出门问问内测大模型“序列猴子”，CEO李志飞：我们不融资也能支撑研发

2023-04-22 04:40:24来源：钛媒体APP

前Google科学家、出门问问创始人兼CEO李志飞（来源：出门问问）

随着人工智能（AI）竞赛加剧，最近两年极少公开露面的李志飞，这次也要加入到国内 AI 大模型浪潮中。

钛媒体App获悉，4月20日出门问问举行的2023 AIGC（生成式人工智能）战略发布会上，前Google（谷歌）科学家、出门问问创始人兼CEO李志飞宣布推出出门问问版GPT、AI 大模型“序列猴子”，并开启内测探索。

(资料图片仅供参考)

同时，出门问问还介绍多款面向创作者的CoPilot（创作助理）产品——AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”、升级版语音助手魔法小问，以及企业（To B）端专属大模型，不仅提供通用能力支持服务和数字人形象定制服务，还将开放自身角色能力，持续迭代数据接口。

李志飞对钛媒体App表示，相比OpenAI研发的GPT-3大约1750亿个参数，“序列猴子”模型参数量约为几百亿个。尽管GPT-4的100分满分相比，“序列猴子”分数是50分，但李志飞认为目前该模型效果确实超出了他的预期，他十分满意。

李志飞强调，中国OpenAI不是出门问问的目标。同时，出门问问近期不考虑融资，不需要外部融资也能支撑研发投入。

“目前公司商业化做得不错，除大模型外，公司其他业务并不太烧钱。此外，出门问问之前的融资也较充足，我们过去还是融了不少钱，所以账上还有不少钱。”李志飞对钛媒体App表示，“可能就是我最后一次All in干的一件事情”。

据悉，成立于2012年的出门问问，是一家以语音交互和软硬结合为核心的 AI 公司，为全球40多个国家和地区的消费者、企业提供 AI 产品和服务。其中包括智能手表TicWatch系列、AI 真无线智能耳机TicPods系列等，以及物联网、金融、车载等场景提供服务，推出的“魔音工坊配音助手”用户近200万。创立出门问问之前，李志飞博士毕业于美国约翰霍普金斯大学计算机系，曾任谷歌总部科学家。

截至2017年4月，出门问问共完成六轮融资，总额超2.55亿美元，投资方包括红杉资本、真格基金、谷歌、大众汽车等。

2021年6月，出门问问推出大模型UCLAI，效果不佳。2022年10月，出门问问重拾大模型的研发。李志飞坦陈，研发过程压力很大，因为研发很烧钱，而且不知道最终结果如何，直到两三周前的一天才发现“序列猴子”的表现不错。

据李志飞介绍，“序列猴子”这个名字的灵感，来源于数学家埃米尔·波雷尔在20世纪初提出了“无限猴子”定理，即只要给予无限时间，一只猴子几乎必然能够打出任何文字，比如莎士比亚的《哈姆雷特》，而如果喂给机器猴子海量的文本序列，通过大规模算力去训练它，就能练就有智能的“序列猴子”，而大模型是一个序列模型。目前，“序列猴子”大模型主要是文本形式，未来则会向多模态的方向发展。

C端方面，在发布会现场，出门问问团队进行了多轮Demo演示，比如，回答“湖南和湖北哪一个省会的人口更多？广东和新疆呢？”等问题，也从一众菜品中为不吃辣、喜欢吃虾的客人推荐了合理的菜品；而回答“天猫背后的公司的创始人本科毕业于嘟个学校？”问题时，也能轻松输出马云本科毕业于浙江师范学院（现浙江师范大学）。

出门问问大模型现场Demo演示（图片来源：钛媒体App编辑拍摄）

不过，有些问题依然会出现和其他GPT大模型一样的反复胡诌、文生图对不上等情况，比如现场让“画一只赛博朋克风格的猫”，结果生成的是一位打扮好的二次元人物。李志飞提到，“序列猴子”大模型的语料也来自于互联网中，“我们需要不断调整它（大模型）的一些对话策略，各种各样的能力输出。”

李志飞指出，在中国做大模型的公司，不论是33分，还是50分以上，都不要焦虑，应该意识到现在的大模型不再像上一代的AI能力有限，它已具备基本的逻辑推理能力，每次都能给人惊喜， “序列猴子”大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。他强调，大模型的训练要循序渐进，不要一上来就搞“应试教育“，大模型的能力可能很快能提升到80分，但是要从80分做到90分以上，仍然会是非常难的事情。

而在B端，李志飞现场透露，“序列猴子”企业专属大模型已在首批汽车、教育、律所、金融、运营商、旅行、传媒、设计、智能硬件、医疗十大行业内测探索伙伴，企业方包括中国移动、中国工商银行、中国一汽红旗、春秋航空、VIPKID等。

李志飞强调，大模型商业化落地首先是创作者，然后是B端，然后才是C端。他透露，在创作者方面，出门问问提供付费服务，B端主要提供定制大模型服务，提供个性化答案，例如把功能嵌入至企业微信里面等。

当被问及中国大模型和美国距离多远时，李志飞认为是16个月。他解释称，2022年1月谷歌发布指令学习大模型FLAN，之后的2022年10月ChatGPT发布，2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近，如此推算，中美大模型的差距为16个月——这与百度CEO李彦宏和搜狗创始人王小川说法都不一致，此前李彦宏认为文心一言和ChatGPT差距只有两个月，王小川认为国内和GPT-4有两、三年的差距。

李志飞称，目前大模型烧钱很厉害，算力是当前重要挑战之一。他提到，现在“序列猴子”模型比较大，没有做太多优化，所以显卡要求比较高，因此算力对于出门问问来说是一个现实的问题，他认为后面应该会慢慢的解决算力需求挑战。

李志飞向钛媒体App透露，现阶段出门问问不需要融资。据悉，自2017年至今的过去七年，出门问问没有公开过最新融资消息。

李志飞强调，中国不会有下一个OpenAI，主要原因是中美创业环境不太一样，不太可能是去重复OpenAI这样的发展道路，国内大部分人还是在思考中国竞争太激烈、商业化如何竞争。

“中国版OpenAI不是我们的目标。我的初心就是要‘造大模型’，理解大模型，再把大模型用起来。”李志飞告诉钛媒体App。（本文首发钛媒体App，作者｜林志佳）

标签：