中国AI与美国的差距还在扩大,北大教授悲观
前字节跳动工程师、北大教授张池指出,中美人工智能差距并未缩小,反而在扩大。国内大模型沉迷于“刷榜”拿高分,实际应用拉胯;训练数据质量低、迭代周期是美国2-4倍、用户付费意愿弱形成负循环。那些美国名人“中国正在赶超”的论调,可能只是美国企业家的“烟雾弹”。
尽管外界普遍说中国在人工智能领域正在赶上美国,在有些领域可能已经领先。但一位前字节跳动工程师认为,实际上差距正在进一步扩大。
周末,北京大学助理教授、研究科学家兼助理教授张池(音译)在《进入亚洲》播客节目中说:“我甚至不同意中国模型正在追赶的假设——我认为我们仍然远远落后。非常遗憾,我认为差距正在扩大”。
张池表示,他在字节跳动的人工智能部门工作了大约一年,专注于人工智能模型,之后重返学术界。他表示,不否认人工智能的中国初创企业在快速发展,但由于美国的发展可能更快,我们必须认识到在我们快速发展的同时,实际上差异不仅没有缩小,反而在持续扩大。这应该是正确认识我们的人工智能行业的重要的一部分。
一、中国大模型专注于如何提高基准测试的得分,但在实际应用中表现拉跨。
张池认为,虽然像字节跳动和阿里巴巴这样的大公司开放的大模型在基准测试中得分不错,但这并不意味着它们在现实世界的应用中表现同样出色。理论上,我们的每家大型科技公司都有好的大模型。但实际上它们还不够好。因为许多大模型团队专注于“benchmaxxing”——更注重考试成绩而非实际表现的模型。如同于我们的一些名头响亮的高中,专注于培训学生如何提高高考得分,成为考试机器,但很少注意如何提高学生的创造力。
字节跳动和阿里巴巴推出了高知名度的AI模型——从像Seedance这样的视频生成器到像Qwen这样的开源系统——但他们也因深度伪造、版权纠纷以及这些模型在现实中是否经得起考验而遭遇了用户端的广泛质疑。
二、中美大模型在基础设施和训练数据方面存在难以弥补的差距。
美国的大模型和中国大模型的基础设施方面存在的巨大差距,是最公开的差距。这种差别不仅仅表现在我们无法获取先进芯片,数据中心基础设施薄弱,这些硬件的差距摆在桌面上,大家容易看到。更大地、大家看不到的差距是大模型训练数据质量较低。我们的大模型无法获得高质量的数据,训练数据甚至被人为污染,这是中国大模型普遍存在结构性劣势。
作者声明:该图片由AI生成
而且,训练大模型的数据质量较低这一劣势难以逆转。因为造成这一劣势的两大原因是制度性的而非技术性的。比如我们对互联网普遍存在的敏感单词的审查导致的语言污染,比如我们的大模型应用产品和软件一样难以获得付费用户,导致人工智能获利模式转向异端——如同互联网时代的搜索引擎一样利用关键词获利,导致训练数据甚至被人为污染。
逻辑上,在被污染的大模型数据面前,大模型的理论评分,有何意义?
很多人不理解我们的大多数大模型公司,为何热衷于并依赖于从领先的美国模型中提取数据,而非建立自己的数据管道。公开的评论大都认为这是一条捷径,可以节省大模型投资。但大家忽略了其背后两大问题:一是依赖对美国大模型的蒸馏,一些人工智能公司可能是迫不得已,因为他们非常清楚我们提供给大模型训练的数据质量堪忧。二是美国三大大模型巨头和白宫,都在出手遏制对其大模型的蒸馏,这必然将限制我们大模型的长期发展。
三、中国的大模型更新迭代的周期是美国的2-4倍。
张池说,我们大模型差距扩大的一个关键问题是速度。他说,美国顶级公司可以更快地迭代大模型。
可以确定的是,谷歌可以在三个月内培训或完成一整轮LLM培训,包括培训前和培训后。但字节跳动和其他几乎所有的模型迭代,周期几乎在半年甚至一年。
我们的大模型迭代较慢,与投入有关,也与用户有关。
此外,更强的用户反馈对大模型的优化大有裨益。美国的人工智能企业也受益于更强的用户反馈循环。像ChatGPT、Claude和Gemini这样的产品,他们通过与用户的持续互动而不断更新、不断提升,有助于随着时间推移优化模型。
相比之下,中国的大模型有陷入负循环的风险。往往中国大模型起初表现不佳,但较少有人真正用它们做重要的事情,所以大模型的优化和更新很难依赖于用户的反馈,导致起点不错的模型难以在后续中继续提高。而缺少用户反馈的主要原因在于大模型使用对象中的中国企业用户和个人用户的现有收入水平,难以负担大模型的收费,比如社交媒体中的专业创作者,他们从平台获得的收入越来越少,使用付费的大模型大幅增加成本而难以同步增加收入。
四、不要沉迷于中国正在缩小与美国人工智能差距的幻觉中。
张池的观点可能与我们媒体上一些最知名的声音形成鲜明对比,许多人认为我们正在迅速缩小与美国的差距,甚至可能领先。
我们的媒体经常援引英伟达首席执行官黄仁勋和特斯拉与space创始人马斯克的观点来证明我们在人工智能方面可以与美国并驾齐驱甚至超越美国。
黄仁勋曾警告称,美国的人工智能有落后风险;而埃隆·马斯克则表示,中国在能源和计算领域的优势可能帮助其超越竞争对手。人工智能先驱杰弗里·辛顿也表示,美国的领先优势可能比表面看起来更小,并警告其可能随着时间推移而缩小。但人们往往忽略了,这些美国的企业家和技术大拿,其表达的背后,并非对我们人工智能发展水平的认可和盖章,指出一个假想敌,制造危机感,吸引更多的投资和政府的支持,才是他们发表这一观点的唯一目的,也一直是美国企业家和官员吸引社会关注某一领域的基本手段。
张池的观点反映了我们人工智能生态系统内部更为悲观的观点——暗示与美国的差距可能正在扩大。但持有这一观点的人可能更多,只是表达更委婉。比如阿里巴巴董事长蔡崇信认为,人工智能竞赛的胜负将更多取决于AI部署的速度,而非模型的评分实力。
三郎自2024年初开始,也一直在使用大模型快速获得全球和一些特定国家的经济数据,生成文章的内容提要,自动校对文章的错字和错词。从初期同时使用国内、国外六个模型,到现在主要依赖ChatGPT和Google Gemini,也是因为国内大模型在实际应用中太一言难尽。
三郎也持有与张池一样的观点:“公平地说,我认为没有哪个中国人工智能公司能很快赶上美国的同类企业”。
- 🔥免费PC翻墙、安卓VPN翻墙APP
- 🔥灵魂之谜|中华文化|治国大道
来源:火星宏观


脸书专页
粉丝交流群