(两会访谈)周鸿祎:中国垂直领域AI大模型超过GPT-4完全有可能

发布时间:2024-11-01 13:59:04 来源: sp20241101

   中新社 北京2月25日电 (记者 夏宾)从去年初ChatGPT掀起人工智能(AI)大模型热潮,到今年初Sora以文生视频技术惊艳世界,国际尖端人工智能技术迭代迅速。中国该怎么走好自己的AI之路?

  “我觉得中国还是有优势的。”全国政协委员、360集团创始人周鸿祎在接受 中新社 等媒体采访时称,中国垂直领域AI大模型超过GPT-4完全有可能。

  众多中国企业打响“百模大战”、中央经济工作会议明确“加快推动人工智能发展”、国务院国资委召开中央企业人工智能专题推进会……中国正积极拥抱AI发展潮流。工信部数据显示,中国人工智能核心产业规模达到5000亿元人民币,企业数量超过4400家,已建设近万个数字化车间和智能工厂。

  从企业活力、政策红利、技术专利、研发动力、产业实力等多维度看,中国都处在全球人工智能领域“第一梯队”。但周鸿祎也提醒,中国与该领域领先的美国确实有差距,主要体现在原创技术方向上。

  “这是客观事实,看到差距才知道怎么迎头赶上。”他指出,不管Transformer模型或Sora,本质上仍是软件,“现在(中国)落后的时间大概是一到两年,是可以解决的”。

  周鸿祎进一步解释称,搞技术最难的是找到原创方向,“谁选择了正确的方向、正确的架构,全世界都会跟着走”。中国只要明确了正确架构,后续进步就会很快,因为中国公司的学习能力很强。

  大方向明确后,同样可以“另辟蹊径”。周鸿祎提出,对中国企业而言,实际上不需要等到技术全面赶上GPT-4或Sora后,才去探索应用落地。过去两年中国企业在通用大模型领域追赶得不错,2024年应该会是中国AI的“应用之年”,在许多企业层面的垂直领域,大模型将大有可为。

  “大模型未来应该要产生一场工业革命,它必须跟随企业进入百行千业,与业务流程和产品功能相结合。”周鸿祎作了一个对比,GPT-4是“啥都懂,但不专”,如果能在某个业务领域积累独特的业务数据,在垂直领域对大模型进行很好的训练,并将其和企业业务工具结合在一起,这样的大模型就不仅有“脑子”,还有独特知识,甚至“手”和“脚”。“中国在一些垂直领域的大模型超过GPT-4,是完全有可能的。”

  周鸿祎认为,企业将来不会只有一个超级大模型,而是会有多个小规模的、百亿级参数的大模型,每个大模型聚焦一个场景的工作,这类大模型再跟企业的业务平台结合。按此种模式,对现在很多企业来说,大模型“完全用得起,而且可以用得很好”。

  谈及当下热词“新质生产力”,周鸿祎表示,它应当是科技创新驱动的生产力、能带来高质量发展的生产力。目前来看,科技创新要赋能大部分传统行业,还是要靠产业数字化。数字化的本质最终是智能化,由此而言,用大模型驱动产业恰恰就是在打造新质生产力。

  周鸿祎透露,今年全国两会他的提案就建议多层面推进大模型研发应用,将大模型打造成新质生产力工具。具体而言,一是坚守安全发展底线,从政策和标准布局,为推动大模型在各城各市、各行各业加速落地做好安全保障;二是发展私有大模型,开拓更多应用场景,发展专业化、垂直化、小型化、低成本的企业级大模型,助力百行千业数字化转型;三是打造普惠大模型,专项扶持降低私有大模型成本,让广大中小微企业用得起、用得上,助力完成“链式”数字化转型。(完) 【编辑:田博群】