特德姜笑了:“当然不是。”
他顿了顿解释道:“据我所知,微软谷歌还有其他一些公司正在研究语言模型,希望人类和机器能够通过某种方式进行沟通和对话,这就需要为机器准备极为庞大的数据库,最好是能够把整个万维网储存下来供机器调用。”
“那是不可能的。”妲露拉摇头道。
特德姜道:“确实不可能,但如果是采用压缩技术,尤其是有损压缩的技术,还是有可能的。这需要编写一个有损算法来识别所有数据中的统计规律,就可以把所有数据信息储存下来,供机器学习和使用。唯一的问题是,由于数据被高度压缩,机器无法通过搜索准确的引用来查找信息,就无法得到一个精确的匹配,只能通过一些要点来进行响应。”
“CHATGPT……不,应该是问心义言……”李睿小声咕哝着。
“你说什么?”特德姜问。
李睿摇头道:“没什么。”心中却翻滚着巨浪,原来这么早就有人提出了类CHATGPT的概念了。
特德姜继续道:“我相信通过类似的技术,人类会在不久的将来得到一种能够对话的人工智能,它保留了万维网上绝大部分的信息,但它无法精确的回答一个问题,而只能在数据库中搜索到一个近似值,再用独特的创建语法文本的技术来展现答案。这个答案会让你觉得还不错,但仔细思考的话,其实经不起推敲,这就是人工智能会在压缩、搜索、展现环节遇到的关键问题,谁能先解决这些问题,谁就有可能在这个领域先行一步。”
十年后,当最初的一批人工智能模型出现时,有的技惊四座,比如CHATGPT,有的丢人现眼,比如问心义言。
前世李睿其实不清楚他们的差距到底在什么地方,现在听了特德姜的讲解,才大概有了一些了解。
问心义言那种乱七八糟的回答不知是哪个环节出现了问题,但CHATGPT确实在数据的采用和文本的创建上有独特的技术,也就难怪一问世就让所有人目瞪口呆了。