八一文学网

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

大语言模型(llm):ai“读懂”语言的核心(第9页)

大语言模型在处理简单逻辑问题时表现还不错,比如“小明有5个苹果,吃了2个,还剩几个?”,它能轻松算出“3个”;但遇到需要多步推理、复杂因果关系的“难题”,就很容易出错,甚至会犯“小学生都不会犯的错”。

这章没有结束,请点击下一页继续阅读!

比如有这样一道逻辑题:“小张比小李大3岁,小李比小王大2岁,请问小张和小王谁大?大几岁?”,有些模型可能会回答“小王比小张大,大1岁”——这明显是逻辑混乱了,正确答案应该是“小张比小王大,大5岁”。再比如数学题:“一个长方形的长是5厘米,宽是3厘米,把它的长增加2厘米,宽减少1厘米,新长方形的面积是多少?”,模型可能会算成“5+2=7,3-1=2,7+2=9(平方厘米)”——把“面积=长×宽”错记成“长+宽”,犯了低级错误。

更复杂的推理题,比如“侦探推理题”:“某仓库失窃,嫌疑人有甲、乙、丙三人。甲说:‘我没偷’;乙说:‘是甲偷的’;丙说:‘我没偷’。已知三人中只有一人说真话,请问谁偷了仓库的东西?”,很多模型会绕来绕去,最后得出错误结论——比如认为“甲偷的”,但实际上正确答案是“丙偷的”(因为如果甲说真话,那么乙和丙说假话,丙说“我没偷”是假话,说明丙偷了,符合“只有一人说真话”的条件)。

为什么模型的逻辑推理能力这么弱?主要是因为:

1. 模型缺乏“真正的思考”:它处理逻辑问题时,还是依赖“模式匹配”,而不是“一步步推导”。比如它在训练数据中见过“A比B大,B比C大,所以A比C大”的句式,就能答对简单的年龄题;但如果题目换了表述方式(比如“A比B小,B比C小”),或者增加了更多步骤(比如“A比B大3岁,B比C小2岁,C比D大1岁,求A和D的年龄差”),模型就会因为没见过类似的“模式”而出错。它就像一个只会背公式,却不懂公式原理的学生,换个题型就不会做了。

2. 长序列推理“记不住中间步骤”:处理复杂逻辑问题需要“记住中间结论”,比如解侦探题时,需要先假设“甲说真话”,然后推导乙和丙的话是否合理,再验证是否符合条件。但大语言模型的“上下文窗口”是有限的(比如早期的GPT-3上下文窗口只有2048个token,相当于1500个汉字左右),如果推理步骤太多,中间结论太多,模型就会“记不住”,导致后面的推导出现混乱。比如推理到第三步时,就忘了第一步的假设,自然会得出错误答案。

所以,咱们在使用模型处理逻辑问题时,尤其是数学计算、法律分析、侦探推理等需要严谨推导的场景,一定要自己再检查一遍。如果模型的答案看起来不对,可以尝试“拆分步骤”提问——比如把复杂的数学题拆成“第一步算新的长,第二步算新的宽,第三步算面积”,让模型一步步回答,这样出错的概率会低一些。

(三)知识滞后:“不知道最新的事”

大语言模型的知识有一个“截止日期”,超过这个日期的新信息,它都不知道——这就像一个人从某个时间点开始就“与世隔绝”,再也没接触过新事物,自然不知道之后发生的事。

比如你现在(2025年)问模型“2024年世界杯足球赛的冠军是哪个国家?”,如果模型的训练数据截止到2023年,它就会回答“2024年世界杯尚未举办”,或者编造一个错误的答案(比如“巴西队”),因为它没学过2024年世界杯的结果。再比如你问“2025年1月中国的CPI(居民消费价格指数)是多少?”,模型也无法回答,因为它的知识更新不到2025年1月。

即使是一些重大事件,比如新的科技突破、新的政策出台、新的名人去世等,如果发生在模型训练数据的截止日期之后,它也一概不知。比如2023年OpenAI发布GPT-4时,它的训练数据截止到2023年3月,如果你问它“2023年10月发生了哪些重大科技新闻?”,它就无法准确回答,因为这些新闻是在它“学习”结束后发生的。

为什么模型的知识会滞后?因为训练大语言模型需要消耗大量的时间和计算资源——训练一次GPT-3这样的模型,需要数千块GPU连续运行几个月,成本高达数百万美元。所以,模型不可能“实时更新知识”,只能定期更新(比如每隔半年或一年重新训练一次)。而在两次训练之间,新发生的事就无法进入模型的“知识库”。

另外,即使模型更新了知识,也存在“信息不全”的问题——比如2024年的某场地方选举结果、某个小众行业的新政策、某个企业的新产品发布等,这些信息可能没有被收录到训练数据中,模型自然也不知道。

所以,咱们在问模型“时效性强”的问题时(比如最新的新闻、最新的数据、最新的政策),一定要注意它的知识截止日期。如果模型回答“我的知识截止到XXXX年XX月,无法提供最新信息”,就需要自己去查最新的来源(比如新闻网站、政府官网、权威数据库)。不要依赖模型获取“近期发生的事”的信息,否则很容易得到过时或错误的答案。

小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!

(四)偏见与价值观:“会继承数据里的‘坏毛病’”

大语言模型会“继承”训练数据中的偏见和不当价值观,比如性别偏见、种族偏见、地域偏见等,在生成内容时不经意间表现出来,甚至会强化这些偏见。

比如你让模型“写一个关于‘医生’的小故事”,它可能会默认医生是男性,写出“王医生穿着白大褂,走进病房,对病人说……”;如果你让它“写一个关于‘家庭主妇’的描述”,它可能会写出“她每天在家做饭、打扫卫生,照顾孩子和丈夫,没有自己的工作”——这些内容隐含着“医生是男性职业”“家庭主妇只能做家务”的性别偏见,而这些偏见来自训练数据中大量类似的表述(比如过去的很多文章中,医生多以男性形象出现,家庭主妇多与家务关联)。

再比如,如果你问模型“哪个地区的人最‘勤劳’?”,模型可能会回答“XX地区的人最勤劳”,而这种回答基于训练数据中对某个地区的刻板印象,忽略了“勤劳与否与个人有关,与地区无关”的客观事实。更严重的是,如果有人故意引导模型生成歧视性内容(比如“为什么XX种族的人不如其他种族”),有些模型可能会生成不当内容,加剧歧视。

为什么模型会有偏见?因为训练数据来自人类社会,而人类社会中本身就存在各种偏见,这些偏见通过书籍、文章、网页等文本形式记录下来,被模型“学”了过去。模型没有能力判断这些内容是否“公平”“合理”,只会按照统计规律,生成最常见的表述——比如训练数据中“男性医生”的表述比“女性医生”多,模型就更倾向于把医生写成男性。

热门小说推荐
这里有诡异

这里有诡异

诡者,妖魔鬼怪也;异者,神秘诡谲也。这里有食人影子的食影,有以梦杀人的梦魇,有以吓唬小孩为乐的猫儿爷,有乘之可穿梭阴阳的阴马车,有只杀人不救人的杀生佛,有只可死人听不可活人看的诡京剧,有行走于街头巷尾卖人肉馄饨的混沌婆婆,有以寿命为买卖的三生当铺……一本神秘的《诡录》,将苏逸带进了这个光怪陆离、神秘莫测的世界。...

夏未央

夏未央

附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!夏未央(连城VIP手打完结)作者:日月青冥内容简介我知道,你我之间这一切不过是一场交易;可我以为,如果有一天你要做出选择,至少,你一定会选择我。直到你笑着挽起她的手头也不回,我才终于明白,原来从头到尾,不过是我自欺欺人的一厢情愿。可这份对你的爱依旧梗在胸口隐隐作痛...

不请长缨

不请长缨

隆安帝二十七年,少年将军周鹤鸣大挫朔北十二部,得胜回朝,被迫成亲。 对方恰好是他心上人……的亲哥哥。 * 周鹤鸣幼时曾到宁州,机缘巧合,惊鸿一遇,单恋抚南侯郁涟许多年,自然知道对方有个怎样糟糕的兄长。 郁濯此人,在宁州坏名远扬,人人嫌恶。 二人大婚当日,郁濯春风得意,周鹤鸣万念俱灰,唯恐避之不及,郁濯却偏要来招惹他。 周鹤鸣如临大敌,誓要为心上人守身如玉,好歹将对方制服,却听见郁濯饶有兴趣地问: “我究竟哪里不如舍弟?” “你说出来,我定分毫不改。” * 恰逢战事又起,周鹤鸣马不停蹄赶回青州,却先等来了自己的白月光郁涟。 郁涟为公事而来,周鹤鸣知此生无缘,但求尽心护其左右。 护着护着,他发现了不对劲。 自己的白月光,怎么私下里行事作风同他的可恶兄长一模一样? 周鹤鸣如遭雷劈,艰难说服自己接受了白月光性情大变的可能性,对方却出其不意地掉了马。 “怎么了小将军?猜到我即是他、他即是我之后,你就不爱笑了。” 【鬼话连篇·钓系混邪美人受x前期纯情忠犬·后期狼狗攻】 周攻郁受,不拆不逆 可怜的周鹤鸣,被郁濯玩弄于股掌之中。 小剧场: 后来青州城外,绯色蔓延,白鼎山四野自阖为笼,并不许他人窥见半分。周鹤鸣一手环人,一手勒马绳,穿行于猎猎夜风。 郁濯仰头看他,开口时吐息潮热:“怎么好话赖话软话硬话都听不得?云野,是只想听我的真心话么?” 笑意层层染上了他的眼,眼下明晃晃露着颗小痣,像是天真未凿、漫不经心。 ——却分明是蓄谋已久的引诱。 周鹤鸣勒住缰绳,郁濯在突然的变速里微微后仰,露点半节修长脖颈,被一口咬住了喉结,周鹤鸣的声音嘶哑着响在耳边。 “你分明知道,我都会信的。” 【食用指南】 1.架空不考究,私设同性可婚 2.1v1,HE,正文主受,有群像,先婚后爱,24K纯甜文(信我 3.年下,攻为成长型人设 4.文名取自贺铸的词,封面是郁濯 5.不控攻/受,一切为故事本身服务...

我在NBA偷戒指

我在NBA偷戒指

——无系统,猥琐流——詹姆斯抱怨道:“我从来没有在超级球队待过。”而陈极会说:“对的,我很幸运,我去的每一支球队都是超级球队,不夺冠就失败的那种。”顺便问詹姆斯哈登一句:“登哥要总冠军戒指吗?”......

长安牛马实录

长安牛马实录

(本文有CP,男女主都不是完美人设,成长型,一定程度上自私,男主是莽夫!且配角不会莫名其妙降智,非无脑爽文。)‘道虽险阻,吾心甚坚’江上弦一朝穿越,勤勤恳恳在长安摆摊卖卤羊肉半年攒钱,准备给大唐餐饮业来一波震撼。凭空出现的神秘来信打乱了所有计划。“什么?这玩意儿还有任务?”“直爹贼!老娘就知道!你大爷的穿越还带业绩......

总裁的七日恋人

总裁的七日恋人

他是权势滔天的帝国总裁,强势霸道,狂妄不可一世。性情高冷禁欲的他,一时兴起将她禁锢在身边,渐渐地护她成了习惯,宠她成了执念,深入骨血的痴恋让她逃无可逃。他说:“我允许你任性,但你必须在我允许的范围内任性。当初你把自己当生日礼物送给我了,这辈子你就是我的!从头到脚都是我的!一根头发丝也是我!”......