合成数据能否成为人工智能隐私问题的解决方案?这家公司正在全力投入

随着越来越多的公司投资于定制用例和产品的生成式人工智能(gen AI),专有数据对于训练大型语言模型(llm)变得越来越重要。与ChatGP...

随着越来越多的公司投资于定制用例和产品的生成式人工智能(gen AI),专有数据对于训练大型语言模型(llm)变得越来越重要。与ChatGPT不同的是,它是根据从互联网上抓取的数十亿公共数据点(电子邮件、脚本、社交媒体、论文)进行训练的,而企业世代人工智能通常需要指定用于该企业的客户数据。

但是,来自真实客户的数据可能包含个人可识别信息(PII),因此使用这些数据存在隐私风险。这就是结构化合成数据公司(主要是人工智能)发挥作用的地方。

周二,该公司推出了一项合成文本功能,可以自动生成合成数据,并保留用户原始数据集的模式。

通过使用合成数据来训练模型,大多数人工智能旨在帮助企业避免隐私风险,同时不牺牲客户数据(如电子邮件、支持记录和聊天机器人交流)可以揭示的见解。根据该公司的说法,合成数据也可以比原始数据代表更多的多样性。

除了隐私之外,其他用例包括重新平衡数据集以使其适合模型或消除偏见并生成用于软件测试的模拟数据。

它是如何工作的

公司将他们的专有数据集上传到大多数AI生成器,这些生成器是受隐私保护的可重用包,其中包括来自原始数据的元数据。用户可以从本地设备或其他外部来源上传数据,并在most AI的平台上微调他们的生成器。

一旦他们确认了正确的配置和编码类型,用户就可以从他们想要使用的大多数AI模型中进行选择,然后从几个语言模型中进行选择,包括HuggingFace的预训练选项。

由此产生的是一个受隐私保护的数据合成版本,它保留了原始的统计模式。

这种设置有助于培训企业的生成器。然后,用户可以使用模型的报告比较合成数据和实际数据,以确保准确性。

大多数情况下,人工智能表示其数据集看起来“与公司原始客户数据一样真实,具有同样多的细节,但没有原始的个人数据点——帮助公司遵守GDPR和CCPA等隐私保护法规。”该公司补充说,它的合成文本“与gpt - 40 -mini生成的文本相比,性能提高了35%,而gpt - 40 -mini生成的文本要么没有提供,要么只有几个真实世界的例子。”

那么,合成数据真的是人工智能的未来吗?

高德纳(Gartner) 4月份的一份报告发现,合成数据在软件工程中具有未实现的潜力,但建议必须谨慎部署。创建合成数据可能是资源密集型的,因为有效地使用它需要针对每个用例进行特定的测试阶段。

“如今,随着模型耗尽公共数据来源,人工智能培训正进入平台期,收益也在递减,”大多数人工智能公司的首席执行官托比亚斯·汉恩在新闻稿中表示。“为了利用高质量的专有数据,这些数据比目前正在使用的剩余公共数据提供更大的价值和潜力,全球企业必须迈出这一步,利用结构化和非结构化合成数据来安全培训和部署即将到来的生成式人工智能解决方案。”

一个普遍的担忧是,人工智能泡沫即将破裂,部分原因是模型正在耗尽可获取的公开数据。虽然这在技术上是不正确的——任何人类活动都可以是数据,它可能只是没有被编码、收集、结构化和免费——但对更多可用数据来训练模型的需求是真实的。毕竟,与将凌乱的手写笔记数字化相比,真正擅长生成合成数据要容易得多(也便宜得多)。甚至meta也使用了人类和合成数据来训练Llama 3.1 405B。

但是模型崩溃呢?模型一旦吸收了太多的合成数据就会恶化。

大多数人工智能公司在给ZDNET的一封电子邮件中表示,它避免了这种可能性,因为“合成数据只生成一次,直接应用于下游任务”,而不是用来反复训练模型。

各行各业越来越多地使用合成数据是否会造成模型崩溃的更大威胁,还有待观察。在那之前,对most AI工具感兴趣的企业可以访问其网站。

本文来自作者[admin]投稿,不代表xfqse号立场,如若转载,请注明出处:https://m.xfqse.cn/zlan/202508-3326.html

(6)

文章推荐

  • 爱尔兰的杰米·芬恩在世界杯斧头上说:“这需要很长时间才能克服

      杰米·芬恩对世界杯的遗憾并没有像加里·沃兹多克和凯文·福利那样深重。今年7月,当一名在9场预选赛中首发6场的球员被国家队剔除时,维拉·鲍的冷酷无情达到了前所未有的程度。她缺席的两场比赛是因为禁赛——第一场是在格鲁吉亚,避免了第三张黄牌;第二场

    2025年06月23日
    12
  • 贾娜·克莱默分享了她对《One Tree Hill》复兴的“积极”看法

      贾娜·克雷默透露,《一棵树山》的复兴项目是由索菲亚·布什、希拉里·伯顿·摩根和丹尼尔·阿克斯共同策划的。根据《美国周刊》的报道,粉丝们一直在呼吁更多关于重启剧情的细节,以及其他受欢迎角色的回归,同时他们也在期待贾娜·克雷默饰演的亚历克斯·杜普雷。

    2025年06月24日
    11
  • 阿联酋总统访问华盛顿国家儿童医院

    华盛顿特区,9月24日(ANI/WAM):阿联酋总统谢赫·穆罕默德·本·扎耶德·阿勒纳哈扬访问了华盛顿特区的国家儿童医院,并听取了该医院在儿科外科和医疗保健方面的开创性工作的介绍。阿联酋一直是该医院的长期支持者,最近的这次访问反映了对加强向年轻患者提供护理的持续承诺

    2025年06月27日
    11
  • 荷兰政府承诺向加沙提供1000万欧元的额外援助

      荷兰政府周二承诺向加沙提供1,000万欧元(1,050万美元)的额外人道主义援助,并称对当地居民迅速恶化的处境感到非常担忧。政府表示,这笔资金是应联合国的要求提供的,将用于满足水和医疗等基本需求。它重申了自己的立场,即在哈马斯发动毁灭性袭击后,

    2025年07月06日
    9
  • 职场福利计划通常不起作用,但这里有一些方法可以让它们变得更好

    世界卫生组织(世卫组织)刚刚发布了令人震惊的统计数据,显示员工心理健康问题每年导致1万亿美元(7470亿英镑)的生产力损失。世卫组织呼吁雇主采取紧急行动,推出全面的福利计划,以解决工作场所不断升级的心理健康危机。但问题是,许多工作场所的福利计划不起作用。英国的一项研究调查了来自233家组织

    2025年07月08日
    10
  • 统一部废除南北对话机构

    {{edit_1}}//...unchangedHTMLcode...{{edit_2}}//...unchangedHTMLcode...{{edit_3}}//...unchangedHTMLcode...{{edit_4}}

    2025年07月10日
    12
  • 特朗普在佛罗里达欢迎以色列总理内塔尼亚胡,与一个重要盟友修补联盟

      4分钟阅读2024年7月26日星期五,以色列总理本雅明·内塔尼亚胡和共和党总统候选人、前美国总统唐纳德·特朗普在佛罗里达州棕榈滩的马阿拉戈会面,这是近四年来的首次面对面会晤,旨在修复两人之间重要的政治联盟。内塔尼亚胡是第一位祝贺乔·拜登赢得2020年总

    2025年07月15日
    14
  • 汇丰银行被评为2024-2025年泰国最佳工作场所之一

    泰国曼谷——2024年10月7日——汇丰银行泰国分行自豪地宣布,该行首次获得泰国最佳工作场所认证。这一殊荣彰显了渣打银行致力于营造一个创新、包容和灵活的工作环境,使员工能够充分发挥其潜力。汇丰泰国首席执行官GiorgioGamba对公司的成就表示自豪:“来自受人尊敬的独立来源的欢迎认可,证实了

    2025年07月17日
    11
  • 玩家攻略宝典“东游麻将手机挂最简单方法”原来确实有挂

    东游麻将手机挂最简单方法是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生

    2025年07月28日
    13
  • 研究发现,吹雪现象加剧北极升温

    提到全球变暖的现象,北极无疑是一个令人担忧的特例。北极的升温速度几乎是全球平均水平的四倍,而气溶胶在这一过程中扮演了重要角色。科学家们早已意识到,来自其他地区的污染物会在北极大气中积聚,改变大气的化学成分,吸收阳光,影响当地的气候模

    2025年07月30日
    8

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年08月01日

    我是xfqse号的签约作者“admin”!

  • admin
    admin 2025年08月01日

    希望本篇文章《合成数据能否成为人工智能隐私问题的解决方案?这家公司正在全力投入》能对你有所帮助!

  • admin
    admin 2025年08月01日

    本站[xfqse号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年08月01日

    本文概览:随着越来越多的公司投资于定制用例和产品的生成式人工智能(gen AI),专有数据对于训练大型语言模型(llm)变得越来越重要。与ChatGP...

    联系我们

    邮件:xfqse号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们