研究:人工智能模型难以识别废话

     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

  Study: AI models struggle to identify nonsense

  在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。

  来自美国哥伦比亚大学的研究团队指出,他们的研究揭示了当前人工智能模型的局限性,并警告在法律或医疗领域使用这些模型仍为时尚早。

  研究人员对9种人工智能模型进行了测试,向它们提供了数百对句子,并询问哪些句子可能在日常交流中出现。

  此外,他们还让100名参与者对几对句子进行相同的判断,例如:“一个买家也可以拥有正品/一个精通高中圆周的人我漫步。”

  这项研究发表在《自然机器智能》期刊上,研究团队将人工智能的判断与人类的判断进行了比较,发现了显著的差异。

  像GPT-2这样的复杂模型,作为病毒式聊天机器人ChatGPT的早期版本,通常能与人类的回答相匹配。

  然而,其他一些较简单的模型表现则不尽如人意。

  研究人员强调,所有模型都存在错误。

  该报告的作者之一、心理学教授克里斯托弗·巴尔达萨诺(Christopher Baldassano)表示:“每个模型都显示出盲点,将一些人类参与者认为是无意义的句子标记为有意义的。”

  他补充道:“这应该促使我们深思,人工智能系统在多大程度上能够做出重要决策,至少在目前是这样。”

  论文的另一位作者塔尔·戈兰告诉法新社,这些模型是一项“令人兴奋的技术,可以极大地增强人类的生产力”。

  然而,他认为,“让这些模型在法律、医学或学生评估等领域取代人类决策可能为时尚早”。

  他说,潜在的陷阱之一是,人们可能会故意利用模型的盲点进行操控。

  随着ChatGPT的发布,人工智能模型在去年突然进入公众视野。自那时起,ChatGPT通过了各种考试,并被誉为医生、律师及其他专业人士的潜在助手。(法新社)

本文来自作者[admin]投稿,不代表xfqse号立场,如若转载,请注明出处:https://m.xfqse.cn/cskp/202506-429.html

(13)

文章推荐

  • 足球——阿斯顿维拉以3-0的胜利重返欧洲顶级舞台

      路透社瑞士伯尔尼6月10日电——阿斯顿维拉在欧冠赛场上以3-0战胜瑞士青年男孩俱乐部,令人印象深刻地重返欧洲顶级球队行列。这是比利亚41年来首次参加欧洲顶级俱乐部赛事,蒂勒曼斯在第27分钟打入首球,随后这支英超球队在旺克多夫球场的人造草坪上展现了统治力。

    2025年06月15日
    11
  • 谁要飞往格鲁吉亚,什么时候?英国航空和易捷航空宣布飞往第比利斯的航班

    易捷航空在2025年春天宣布开通一条从伦敦卢顿机场到第比利斯的低成本新航线,不久之后,英国航空公司也采取了反制措施,将伦敦希思罗机场到格鲁吉亚首都的航班数量增加了一倍。从希思罗机场到卢顿的新航线将把平均飞行时间从8小时减少到5小时。第比利斯正成为一个越来

    2025年06月23日
    10
  • 穆罕默德•哈立德(Mohamed Khaled)表示,18架FA-50M战机的建造正在按计划进行,首批交付时间定于2026年

      国防部长拿督斯里穆罕默德·哈立德·诺丁表示,马来西亚订购的18架FA-50M轻型战斗机的建造已经达到39%,马来西亚皇家空军预计将在2026年接收首批FA-50M战斗机。他说,所有这些轻型战斗机都在韩国按计划建造。FA-50M的采购是RMAF能力发展计划2055(CAP55)

    2025年06月28日
    8
  • 随着华尔街恐慌指数跃升50%,投资者密切关注美联储的下一步行动

    在对美国经济衰退的担忧加剧之际,全球股市周一遭受重大打击,引发投资者和分析师就美国联邦储备委员会(美联储,fed)是否需要加快宽松政策以支持经济增长展开辩论。最新的市场动荡推动CBOE波动率指数(也称为VIX指数)上涨约50%,至35.16,为2020年10月以来的

    2025年06月28日
    8
  • 辐射76:在哪里找到星光浆果

      星光浆果是《辐射76》中用于制作多种消耗品的重要食材。虽然这些水果本身的价值不高,但作为烹饪材料时,它们能制作出游戏中一些极具价值的食物,比如BerryMentats。接下来,我们将介绍如何解决辐射76中Bethesda.net账户链接失败的问题,以便您

    2025年06月29日
    7
  • 财政部长回应预算监督机构的“财政花招”批评

    英国财政大臣麦格拉斯反驳了预算监督机构的说法,称10月份增加资本支出的决定是正确的。爱尔兰财政咨询委员会(Ifac)在其最新评估中的关键点是,如果政府继续对covid-19后的巨额预算施加压力,将面临经济过热的风险。但麦格理表示,增加资本支出

    2025年07月04日
    9
  • 的电流响应光有感觉是不够的

      在任何情况下都不能容忍没有事实根据的恶意诽谤。然而,最近一些杂志和网站对皇室进行了猛烈的批评。关于秋篠亲王家族的毫无根据的内容尤其突出,只能用抨击来形容。这种谎言和抨击不应该在言论自由的旗帜下得到保护。不幸的是,无礼和粗鲁的人是猖獗的,即使在数字上他们是非常少数。最近的诽谤案件

    2025年07月12日
    8
  • 《全蒙蒂》男星汤姆·威尔金森死后被誉为“英国演艺界的皇室成员”

    两次获得奥斯卡提名的演员汤姆·威尔金森去世,享年75岁,被誉为“英国演艺界的皇室成员”。他的家人说,这位英国演员于周六在家中突然去世,他因在《欢乐满月》中饰演钢铁厂前工头杰拉尔德·库珀而闻名。他的搭档威廉·斯内普在片中饰演加兹(罗伯特·卡莱尔饰)

    2025年07月20日
    12
  • 电影制片人摩根·斯普尔洛克死于癌症,享年53岁

      奥斯卡提名纪录片制片人摩根·斯普尔洛克去世,他最著名的作品是对美国食品工业的抨击,他曾在麦当劳吃了一个月的饭,以说明快餐饮食的危害。他享年53岁。斯普尔洛克的家人今天发表声明称,斯普尔洛克周四因癌症并发症在纽约去世。“这是悲伤的一天,我们向我的兄弟摩根告别,”曾与他合作过几个项目

    2025年07月25日
    10
  • 律师表示,曼彻斯特机场事件让家庭生活“彻底改变”

      社交媒体上流传着关于曼彻斯特机场骚乱的一个家庭,他们的律师表示,他们的生活已经“彻底改变”。一段手机拍摄的视频显示,19岁的FahirAmaaz和他25岁的兄弟MuhammadAmaad来自罗奇代尔,在被警方控制时,一名警察似乎踢了Fahir的头,甚至还踩了上去。《曼彻斯特晚

    2025年07月29日
    9

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月16日

    我是xfqse号的签约作者“admin”!

  • admin
    admin 2025年06月16日

    希望本篇文章《研究:人工智能模型难以识别废话》能对你有所帮助!

  • admin
    admin 2025年06月16日

    本站[xfqse号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年06月16日

    本文概览:     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

    联系我们

    邮件:xfqse号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们