手机浏览器扫描二维码访问
孟繁岐的这番话,听起来让人觉得不是那么舒服。
言下之意,给人一种华国AI技术就是不如国外的感觉。
这是李彦弘不大喜欢的,毕竟他这么早就关注AI技术,就是为了研发最前沿最先进的技术。
孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量发表的AI论文所迷惑。
觉得在这个新崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。
虽然AlphaGO震惊了世人,但毕竟有些华而不实。
直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。
实际上,并非是技术手段和算法层面上相差太远。
更多的还是因为优质数据的数量不足。
白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。
很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。
文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。
可见即便不是全部,文心一言这个所谓的专注中文的超级大模型,也在相当程度上借助了英文基础的模型权重和技术。
究竟为何要这么做,说到底还是基础不够扎实牢靠。
整理数据,清洗数据,给数据打上高质量的标签。
这些都是脏活累活,见效慢的工作。
把别人公开的数据拿过来跑一跑训一训,多么方便快捷?
以国内996大厂的内卷风气,很难容下长回报周期的基础建设。
早些时候看看不出区别,只觉得国内大厂频繁在XX榜单上露面,刷榜,又是超过这个,又是超过那个。
直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。
“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。
“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”
“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的....”
此消彼长之下,差了多少珍贵的数据啊...
违法穿越者包括但不限于无证穿越非法组织轮回者穿越成立违法穿越聊天群时空管理局提醒您穿越需谨慎,请在万界交通法的法规下进行合法合规的穿越行为,谨防偷渡诸天组织的诱惑,请勿上当受骗。各位书友要是觉得开局逮捕无证穿越者还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...
第一卷简介东野空穿越东京,意外使得系统融合变异,成为一心二身的史莱姆。但东京妖魔横行,神佛冷眼旁观,东京彻底沉沦为妖魔乐园。人类求神不得,求佛不能,唯有自救!但我,东野空,不做人!第一卷,完第二卷简介东京沉沦事件结束之后,东野空的人类身意外接到一个任务,需要他潜入黄泉神国,解救安倍晴明和芦屋道满。但在这时,天照却找上门来,要求东野空杀死安倍晴明和芦屋道满注1本书第一卷偏群像,三思而后看。注2封面与内容无关,不是同人。...
当纳兰馥带着自己神奇的小破药箱,穿成了大梁太傅府中温柔知礼,弱柳扶风的娇娇女时,就已经想好要做一朵安稳度日的白莲花。ampampbrampampgt 大哥我家娇娇最是温柔善良了。ampampbrampampgt 某个刚刚被砍断了手臂的大臣那...
三年前,秦浩送外卖的时候,被豪车撞倒了,没想到反被车主逼着跪在车前忏悔,被豪车大灯照了一个晚上,秦浩的双眼就此瞎了。从此,他悲惨的人生开始了为了替父还债,秦浩成了上门女婿,受尽歧视鄙夷,过着憋屈的生活三年之后,秦浩睁开双眼,一道神芒闪过。...
前任游戏公司画师的贾亚鹏惊喜的发现,自己居然是个富二代,父母给自己留下了一座方便面工厂,还有一对双胞胎妹妹,以及一群半年没发工资的工人。立志让自己的儿子成为富三代的贾亚鹏,决定将99年才上市的小浣熊方便面和水浒英雄卡,提前出现在90年这个风起云涌的时代,收获了第一桶金。紧接着发售四驱车,开发打字学习机,宠物小精灵的游戏和动画同时发售传奇梦幻西游英雄联盟中文网收购漫威,创造封神宇宙。同时,研发华夏自己的主机,创造华夏的主机游戏生态,让华夏人走出氪金网络的捞钱怪圈,成为无数3A游戏的摇篮。顺便再比苹果早两年发布phone,让苹果直接崩盘,无力回天。一个巨大的超级游戏文娱科技帝国,新一代的世界首富,在贾亚鹏的手中诞生了。...
冯君身为985的双学位,毕业就失业了,在都市中艰难打拼,偏偏还放不下架子,他的处境可想而知。 直到有一天,他和手机被雷劈了,猛然发现,原来自己可以化身数...