上海AI产业正创造属于自己的“核爆点”
创始人
2025-02-16 07:19:02
0

DeepSeek横空出世后,热度一直不减,令AI大模型企业振奋,也令国人兴奋和自豪。

网友并非只追互联网热梗,很快总结出DeepSeek诞生的背后:有一支“闷声干大事”的团队,以及一个“无事不扰、有求必应”且足够有耐心的政府。

上海有这样的故事吗?最有发言权的是上海本土的AI大模型企业。大家给出的真实反馈是,以上海人工智能产业的发展能级和这座城市骨子里的实干精神,上海正在书写着自己的故事。

在浦东、徐汇、杨浦以及临港新片区等上海人工智能产业发展的重点区域,企业聚焦芯片、大模型、人形机器人等前沿技术,正在创造属于自己的“核爆点”。

1

“每年春节都有惊喜,去年是OpenAI的文生视频大模型Sora,今年就是我们中国自己的推理大模型DeepSeek-R1。”位于徐汇西岸的中国首个大模型创新生态社区“模速空间”,DeepSeek在这里不仅是热议的谈资,更是会实打实接入各家企业自研大模型的重要帮手。

自2023年9月揭牌以来,模速空间仅用38个昼夜就实现一期近1万平方米空间从毛坯到让企业拎包入住。截止至2024年底,这里已有255家大模型企业、34个备案大模型、100余家投资机构成功落地,未来将建成10万平方米的产业空间。

首批入驻模速空间的秘塔科技是一家AI搜索大模型研发企业。除夕夜,他们就接入了“满血版”的DeepSeek-R1推理模型。公司首席运营官王益为说,DeepSeek擅长的深度思考能力可在秘塔既有的AI搜索基础上,对不同的可信数据源之间进行比较推理并提出观点,颇具启发性,能帮助开发者更好地优化其自研大模型。

记者采访模速空间多家AI大模型企业时发现,大模型开发者之间虽有竞争或理念差异,但对整个行业里程碑式的跨越都有一种惺惺相惜的感触。而大模型开发与其他许多科创行业一样,都需要一颗赤子之心,一股“板凳须坐十年冷”的坚持。

再看过去半个月里“老生常谈”的问题:DeepSeek用强大的算法打破了“唯算力论”的限制,算力和语料还重要吗;都说上海发展大模型的优势在于应用场景,基础模型的发展水平又如何?

模速空间内,来自大模型应用层的企业认为,应用端始终是上海的强大优势,但Minimax、阶跃星辰等上海基模企业的开发能力同样强大。“对于真的想做好大模型、想干事的人来说,他人的成功一定是激励,而非震慑。”一位大模型从业者总结。

“算力重不重要”的答案更显而易见。一位开发者举例:如果用600-700亿规模的参数来更新一个模型,几百张卡的算力需要一个月后才能得出实验结果。而如果使用万卡级别的算力,2天就能完成。“同样的时间,别人训练一次模型用时3小时,而你花了3天,那么别人就能得出更多结果、试验更多变化。”

为此,徐汇区正依托模速空间,打造具备9大算力合作伙伴、超5万张卡的算力调度平台,全区规划30EFLOPS算力资源,在区级层面充分托举大模型企业。

2

在模速空间A区的公共休闲区,记者与一位刚来此一年多的海归大模型创业者聊天时,对方连说了2次“上海是中国最重视AI的城市”。

对企业来说,“重视”最直接体现在真金白银上。以模速空间为例,除了租金支持和来自徐汇资本、临港集团的投资外,还有一项对所有大中小企业来说都称得上“惊艳”的服务:实打实的算力补贴。

“创业6年,搬来模速空间后,我才第一次真真正正拿到了算力补贴。”模速空间一位大模型企业的联合创始人向记者感叹。此前,他带领团队在其他地方参加过几次大模型比赛,试图拓宽获取算力的渠道。“最后大家都拿着‘大支票’一起照相了,结果允诺的补贴没有了下文。”

为何光“履行算力补贴承诺”一项服务,就足以让企业拍手称赞?省钱是一方面,大模型还是一个与时间赛跑的产业,获取算力越便利,意味着训练模型时跑完一次模型的用时越短。这直接关系到模型优化与迭代的效率,更决定着能否抢占市场先机。

“有算力补贴是真给”不只有模速空间一家。在位于浦东张江的大模型产业生态集聚区“模力社区”,人工智能领域的高端人才团队最高可获得700万元的个人及团队赞助以及最高1亿元的项目补贴。

有网友讨论何谓“最懂科技企业的政府”。在上海AI大模型企业眼中,知道企业缺什么,且能随时为企业补位、补链的政府,何尝不是“最懂企业”。

不少大模型企业希望,接下来上海从区级层面开始,能加大真实场景和数据的开放。

有企业直言,希望数据开放能进一步放宽,企业能看到使用者对大模型应用的真实反馈,有更开放的产业生态,对工业制造、医疗、政务等场景的数据进一步开放,让企业获取更多高质量语料。但这是一项系统性工程,涉及隐私保护、数据脱敏、信息安全等多方面,唯有政府牵头方能有序推进。

还有一项当务之急:为传统企业实现数字化赋能。“上海企业多、企业质量好,在借助大模型工具加快数字化转型方面大有可为。”

3

DeepSeek横空出世,“开源”概念进一步为人关注。更长远看,开源代表了一种谦逊的姿态,即大模型还未达到业界所共同追求的通用人工智能(AGI)的效果。

大模型产业瞬息万变,每当有行业“爆点”出现,大模型企业除了自身的产业分析与洞察,又希望政府部门提供怎样的支持与帮助?

“希望模速空间或者区政府部门组织一些闭门交流会,让从业者们坐下来毫无顾忌地交流、碰撞思想火花,可以是纯技术分享,也可交叉不同垂类赛道来共同探讨行业前景。”一位大模型企业负责人这样建议。“光一家企业很难做到交流的多元性,唯有政府或模速空间这样的平台,才有汇集行业内所有人的力量。”

企业越发多样且专业化的诉求,也倒逼政府职能部门的干部们不断学习,加强专业服务能力。

记者采访过不少科创企业、AI企业,只要提前做足功课,提的问题专业,企业其实很乐意与记者聊关于数字人、大模型,以及更加精深的专业领域话题,从成本投入到业绩分析都愿意分享。

这给人一种什么感觉——真正认真干事的人,对待专业都心怀一颗赤子之心,愿意与同频之人分享经验和困惑,共促成长。

科创企业对于媒体采访是这样,对于区、街道招商服务人员上门服务、政府部门举办座谈会等,也是如此。“你懂我,我们才能在一个频道交流互动;当我需要的时候,才可能得到实实在在的帮助。”

对于DeepSeek的成功,有位大模型开发者的话令记者印象深刻。“通过极致的软硬件性能优化与适配,把这样一条一开始并非所有人都看好的路走通了。”

把一条路走到极致,常常要经历漫长的时期。其间会有不少企业因资金断裂或丧失信心而中途放弃。是帮助更多企业坚持到黎明之后,还是尊重市场自然的优胜劣汰规律?这既考验政府把握“为与不为”的尺度,更考验对产业的战略眼光。

但眼前已有不少好建议。有融资已经超过10亿元的大模型企业建议,类似模速空间这样的平台要更紧密关注初创阶段资源少、资金紧的团队,保持大模型产业的生态梯度。

还有企业提出,希望上海进一步优化大模型企业的容缺容错机制,尤其针对大模型的“知识幻觉”所造成的信息偏差、用户投诉,能给予企业一定的容错机会及时纠正,而非“一上来就提处罚”。

“大家都在为这个行业好”,在上海大模型领域,在各区相关产业区域,这早已是一条共识和行为准则。

相关内容

热门资讯

浙江国企首批26个“人工智能+...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:环球网资讯)...
被家暴16次女子:91万没拿到 “两年被家暴16次”当事人小谢与前夫贺某阳及其家人的民间借贷纠纷案持续引发关注。此前,成都武侯区人民...
“十四五”高质量发展答卷丨“十... (来源:中工网) 央视网消息(新闻联播):7月17日,国...
全球瞭望丨英媒:贸易威胁与高关... 转自:新华网  新华社伦敦7月17日电(记者 赵家淞)英国《金融时报》17日发表美国卡内基国际和平研...