【中文世界能不能诞生ChatGPT一样强大的AI对话机器人?】ChatGPT的强

寄春看科技 2023-02-09 07:49:41

【中文世界能不能诞生ChatGPT一样强大的AI对话机器人?】ChatGPT的强大源自AI算法,更来自巨大的语料数据库。ChatGPT给出的回答,并非来自创造力和想象力,而是按照算法对人类“喂”给它的语料数据进行检索清洗、组合优化输出的结果。

语料库的丰富程度和质量,决定了ChatGPT的强大程度。中文不输于英文等其他语言,但数字化、网络化的中文信息量则远远不如英文。W3Techs的数据,在全球前一百万浏览量的网站中,以中文为信息表达载体的网站仅占1.3%,排所有语言的第十位,英语占比高达59.3%。

语言信息的池子小,必然导致训练AI模型的语料库弱,进一步影响AI机器人的能力。我们曾经梳理过机床领域的情报信息语料库,从各类专业数据库、数字图书馆、公开网页上检索文章、报告、书籍等内容,有价值的中文信息远不如英、俄、德语量大,更新速度也有很大差距。中文信息的重复率高,同一个语料关联的信息经常是相互低质量“借鉴、组合”,总体质量水平不高。

量少、重复、低更新率、低质量的中文信息,已经导致中文搜索引擎的效率大幅下滑(也有搜索引擎公司的主观原因),基于这种信息梳理、清洗的语料,很难训练出ChatGPT程度的机器人。简单的说:池子小、输入少,输出强不了,海量信息和湖量信息训练出的AI,大概率有差距。

此外,中文世界的忌语多,AI机器人不懂忌讳,但语料库的维护者懂,中文ChatGPT很可能是天残地缺的AI,我不敢问,它不能答。当然,我们在中文圈子里弄出个像样的AI机器人,是没任何问题的,就像百度可以成为中文搜索引擎最强。

中国没必要和ChatGPT去拼,ChatGPT获取信息的源头是语言文字,干脆绕过语言文字,利用各种传感器给机器人赋予视觉、听觉、触觉、嗅觉,从物理世界采集真实数据,由真实数据训练和驱动机器人的回应和行为,不需要反复对话,直接干起来。

1 阅读:271

评论列表

悟空

悟空

1
2023-02-09 10:18

科幻电影就在身边

就想说些什么

就想说些什么

2023-02-09 22:44

如果中国是世界第一科技强国,结果就另当别论了。

细雨

细雨

2023-02-09 20:54

现在chatGPT给出错误答案的比例还是比较高的。写一些非科学性的无关是非的文科文章尚可,但对要求严谨的科学性和准确性的科技类内容还是有较高的错误率的,在这种情况下,有些大v们或媒体用chat写作后再冒名发表,就会有很强的欺骗性,如果是医药健康方面的,百姓们按这些错误去买药,就真的会是图财害命了。由于chat会使非专业人士也可以冒充专家来组织专业术语而不是正确的知识,因此,将来互联网会充斥着很多让绝大多数非专业人士真假莫辨错误知识,将遗害无穷!

碧云天

碧云天

2023-02-09 22:45

我们的科技都用在社区卖菜,售楼处人脸识别上了

YAN

YAN

2023-02-10 00:48

有种中国又成最大书架的感觉。

寄春看科技

寄春看科技

感谢大家的关注