这要归功于计算机历史博物馆和Google的合作。源代码最初由多伦多大学研究生AlexKrizhevsky编写,现已上传到GitHub。
AlexNet是一种神经网络,标志着计算机识别和分类图像能力的重大突破。到2012年,神经网络背后的理论(包括关键的反向传播算法)已经存在了几十年。然而,缺少两个关键组件:训练这些网络所需的大量数据集和处理它们所需的原始计算能力。斯坦福的ImageNet项目和NVIDIA的CUDAGPU编程等计划最终提供了这些关键元素。
这些进步使Krizhevsky在人工智能先驱GeoffreyHinton和IlyaSutskever的指导下训练AlexNet并释放深度学习的全部潜力。这是深度神经网络、大数据集和GPU计算首次结合在一起,并取得了突破性的成果。每个方面都对彼此至关重要。
最终,AlexNet论文在2012年的一次计算机视觉会议上发表。当时,大多数研究人员对此不以为然,但现在被公认为人工智能先驱的YannLeCun立刻意识到了它的重要性,称其为该领域的转折点。事实证明他的预测是正确的。在AlexNet发布后,神经网络迅速成为几乎所有前沿计算机视觉研究的基础。
AlexNet的突破在于证明了训练一个相对简单的神经网络可以在图像识别等高度复杂的任务上实现超越人类的表现。这标志着深度学习范式的诞生,在这种范式中,机器通过摄取和建模大量数据集来掌握技能。
从那一刻起,进步开始迅速加速。神经网络以前所未有的速度发展,取得了许多里程碑式的成就,例如在围棋比赛中击败人类冠军、合成逼真的语音和音乐,甚至生成原创艺术和创意写作。然而,生成式人工智能的真正转折点是2022年OpenAI发布ChatGPT,这可以说是深度学习进化的巅峰。
可以理解的是,开源这样一段具有历史意义的代码绝非易事。计算机历史博物馆必须与Krizhevsky、Hinton(现就职于Google)和Google的法律团队进行长达五年的谈判,才能获得发布原始源文件的批准。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】