·发表于Towards Data Science ·7 分钟阅读·2024 年 10 月 18 日
--
前总统巴拉克·奥巴马开玩笑地把脚趾放在天平上。照片由皮特·苏扎拍摄,来源于flickr.com
“对于计算机来说,理解这张图像像你我一样需要什么条件呢?我挑战你思考一下,所有需要的知识点都必须到位,才能让它有意义。” [1]
十二年前,2012 年 10 月 22 日,安德烈·卡帕西(Andrej Karpathy)发表了一篇标题为《计算机视觉和 AI 的现状:我们真的,真的还很远》的博客文章[1]。
在他的博客文章中,他以前总统巴拉克·奥巴马开玩笑地把脚趾放在天平上为切入点,谈论了 2012 年计算机视觉和人工智能(AI)的现状。
Karpathy 认为,AI 模型需要拥有关于我们世界的广泛知识,才能基于图像中像素的数值进行推理,不仅要理解发生了什么,还要理解为什么它是搞笑的。
“令人难以置信的是,所有这些推理都从一个简短的…