您的位置:首页 >财经 >

回应来了!OpenAI公布保障AI安全的六大方法

2023-04-06 12:01:16    来源:金十数据

在迎来诸多质疑以及指责后,美国当地时间4月5日,ChatGPT研发者OpenAI在其官网中发布了题为《Our approach to AI safety》(《我们保障AI安全的方法》)的文章,介绍了该公司确保AI模型安全性的部署,以下为GPT-4翻译的全文内容。


OpenAI致力于确保强大的AI安全且具有广泛的益处。我们知道,我们的AI工具为当今的人们提供了许多好处。全球各地的用户告诉我们,ChatGPT有助于提高他们的生产力、增强创造力并提供定制的学习体验。我们也意识到,与任何技术一样,这些工具带来了实际风险,因此我们努力确保在系统的各个层面都建立安全保障。

构建越来越安全的AI系统


(资料图片仅供参考)

在发布任何新系统之前,我们进行严格的测试,征求外部专家的反馈,使用诸如基于人类反馈的强化学习等技术改进模型行为,并构建广泛的安全监控系统。

例如,在我们最新的GPT-4模型完成训练后,我们花了6个多月的时间在整个组织内部努力工作,以使其在公开发布之前更加安全和更具一致性。

我们认为,强大的AI系统应该接受严格的安全评估。我们需要监管以确保采用此类做法,并积极与政府合作,制定最佳监管形式

从现实世界中学习以改善保障措施

在部署之前,我们努力预防可预见的风险,但实验室中我们能学到的东西是有限的。尽管进行了广泛的研究和测试,我们无法预测人们将以何种有益的方式使用我们的技术,也无法预测人们会如何滥用它。这就是为什么我们认为从现实世界中学习是随着时间推移创建和发布越来越安全的AI系统的关键组成部分。

我们谨慎而逐步地发布新的AI系统——设有严格的保障措施——逐渐扩大的用户群,同时根据我们学到的经验不断改进。

我们通过自己的服务以及API,使开发人员能够将此技术直接嵌入到他们的应用程序中,从而提供我们最有能力的模型。这使我们能够监控和采取行动制止滥用,不断建立应对实际滥用方式的缓解措施,而不仅仅是关于可能出现的滥用情况的理论。

现实世界的应用还使我们能够针对对人们构成真正风险的行为制定越来越细致的政策,同时仍然允许我们技术的诸多有益用途。

至关重要的是,我们认为社会必须有时间来适应并调整以适应越来越强大的AI,而且受这项技术影响的每个人都应该对AI的进一步发展有重要的发言权。迭代式部署帮助我们更有效地将各方利益相关者纳入AI技术采用的讨论中,而如果他们没有亲身体验这些工具,这将无法实现。

保护儿童

我们安全工作的一个关键重点是保护儿童。我们要求使用我们的AI工具的人必须年满18岁,或者在父母同意的情况下年满13岁,并正在研究验证选项。

我们不允许我们的技术用于生成仇恨、骚扰、暴力或成人内容等类别。与GPT-3.5相比,我们的最新模型GPT-4在响应不允许内容的请求方面减少了82%的可能性,我们建立了一个强大的系统来监控滥用行为。GPT-4现已向ChatGPT Plus订阅者提供,我们希望随着时间推移,让更多人使用它。

我们已经付出了巨大的努力,以尽量减少我们的模型产生损害儿童的内容的可能性。

除了我们默认的安全护栏外,我们还与像非营利性的可汗学院这样的开发者合作,可汗学院已经构建了一个AI驱动的助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手,为他们的使用案例提供定制的安全缓解措施。我们还在开发允许开发者为模型输出设置更严格标准的功能,以更好地支持希望获得此类功能的开发者和用户。

尊重隐私

我们的大型语言模型是在包括公开可用内容、许可内容和人类审查员生成的内容等广泛文本语料库上进行训练的。我们不使用数据来销售我们的服务、做广告或建立人物档案,而是使用数据让我们的模型对人们更有帮助。例如,ChatGPT通过对人们与其进行的对话进行进一步训练而得到改进。

尽管我们的部分训练数据包括在公共互联网上可获取的个人信息,但我们希望我们的模型了解世界,而不是私人个体。因此,我们努力在可行的情况下从训练数据集中删除个人信息,对模型进行微调以拒绝请求私人个体的个人信息,并回应个人要求从我们的系统中删除他们的个人信息的请求。这些步骤将使我们的模型生成包含私人个体个人信息的回应的可能性降到最低。

提高事实准确性

如今的大型语言模型根据之前看到的模式预测下一系列单词,包括用户提供的文本输入。在某些情况下,接下来最有可能的单词可能并不是事实上准确的。

提高事实准确性是OpenAI和许多其他AI开发者的重要关注点,我们正在取得进展。通过利用用户对被标记为错误的ChatGPT输出的反馈作为主要数据来源,我们已经提高了GPT-4的事实准确性。与GPT-3.5相比,GPT-4生成事实内容的可能性提高了40%。

当用户注册使用该工具时,我们努力尽可能透明地告知ChatGPT可能并不总是准确的。然而,我们认识到,还有很多工作要做,以进一步减少幻觉的可能性,并教育公众了解这些AI工具的当前局限性。

持续的研究与参与

我们认为,解决AI安全问题的实际方法是,花费更多的时间和资源研究有效的缓解措施和对齐技术,并针对现实世界的滥用进行测试。

同样重要的是,我们还认为,提高AI的安全性和能力应该并行进行。我们迄今为止最好的安全工作来自与我们最有能力的模型合作,因为它们更擅长遵循用户的指示,更容易引导或“指导”。

我们在创建和部署更有能力的模型时会越来越谨慎,并将随着我们的AI系统的发展不断加强安全预防措施。

尽管我们等待了超过6个月才部署GPT-4,以便更好地了解其能力、优势和风险,但有时可能需要比这更长的时间来提高AI系统的安全性。因此,政策制定者和AI提供商需要确保AI的开发和部署在全球范围内得到有效治理,这样就不会有人为了领先而抄近路。这是一个需要技术和制度创新的艰巨挑战,但我们非常愿意为此作出贡献。

解决安全问题还需要广泛的辩论、实验和参与,包括关于AI系统行为的界限。我们已经并将继续促进利益相关者之间的合作和开放对话,以创建一个安全的AI生态系统。

该文由GPT-4翻译完成

风险提示及免责条款:市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负

标签:

相关推荐

速读:英雄之光|从来不曾忘记,我为烈士寻亲

英雄之光丨写给因公牺牲警察丈夫的一封信:身为警嫂,我决不拖你后腿

最新快讯!富国银行:美国服务业的韧性遭受质疑

在业主托管的房子里意外发现22万现金,他紧张得一宿没睡好觉

环球今亮点!清明节蔡英文见麦卡锡,他们真是挑了个好日子

每日消息!俄媒:普京当美驻俄大使面指责美国使用“颜色革命”工具

环球观天下!这个清明,我们把大家的留言带到了英烈墓前

动态:“英雄之光”系列思政课|一腔热血守万里长空

当前观点:英雄之光丨戍边烈士陈红军家人到陵园祭扫:你爱吃的 我们都带来了

【英雄之光】清明祭英雄:跨时空“重逢” 全球球精选

【播资讯】欧佩克+送上助攻,乌拉尔原油价格冲破“封印”

永州市诗词协会邀请专家在蘋洲书院讲座并开展读书活动

波兰总统:未来将向乌克兰再交付6架米格战机

环球快资讯丨【新疆故事】哈萨克族刺绣非遗传承人:想在创新方面做出努力

世界热议:侨胞高喊“卖国贼”,抗议蔡英文窜美见麦卡锡

环球热议:天津:校企紧握手 科创产业融合发展

华南地区部分河流发生超警洪水,水利部门全力做好防御工作

为抑制通胀 美联储或再次加息-全球新视野

吃饭要等位,打卡要排队!清明节北京商圈客流涨了两成

法籍教师:法中关系充满潜力 期待两国关系更好|热门看点

清明节,烈士陈祥榕的墓前摆上了一盒喜糖

英雄之光丨戍边烈士陈红军家人到陵园祭扫:你爱吃的 我们都带来了

摩根大通首席执行官:美国银行业危机影响将持续数年

这个清明,我们把大家的留言带到了英烈墓前

全球资讯:驻捷克大使冯飚:希望斯柯达同中企深化合作,抢抓中国市场机遇

世贸组织预测今年全球商品贸易量增长将放缓至1.7%

北京明天白天大部地区有雨,北风较大,注意防风防雨|当前简讯

每日头条!洪都拉斯外长:中洪建交顺应历史发展大势

“索要千万逼死老公案”一审宣判:翟欣欣退还男方上千万财产

用最高礼遇!尽最大努力!-每日看点

热点在线丨“英雄之光”系列思政课|英雄魂归处

未远去 未忘记!四川木里救火勇士牺牲四周年祭

发挥香港离岸人民币枢纽作用 助力人民币国际化|世界快看点

万人说新疆|苹果村第一书记

用最高礼遇!尽最大努力!

每日报道:清明假期品敦煌艺术

小非农远不及预期!就业市场开启速冻模式?

强生公司拟支付89亿美元解决婴儿爽身粉涉嫌致癌索赔

船上视角看台湾海峡中北部联合巡航巡查

焦点日报:北京城市副中心运河游船新增大光楼航线,接下来还将推出夜游项目

紫竹院公园多项传统文化活动过清明|每日动态

【微视频】最后一刻,同样的抉择

全球观天下!诗意微动画|古人这场清明雅事流行了上千年

天天快播:踏青出游好时节 文明出行存心间

《顶尖交易员》系列二十:市场的基本面因素有哪些?

环球聚焦:2023年清明节假期国内旅游出游2376.64万人次,预计国内旅游收入65.20亿元

观天下·美国政局|特朗普抵纽约准备出庭 现实版党争剧高潮迭

民政部:2023清明节1039.46万人次选择绿色低碳祭扫

英雄之光|你曾守护的山河,如今万里锦绣

英雄之光丨致敬“独胆英雄” 传承青春力量

外媒:中国的世界秩序观更具吸引力

世界看热讯:北京今天夜间阴有小雨,预计空气质量1级优

环球短讯!居民占用小区公共绿地种菜,石景山这一社区清理了10处

脸部圆润、面带笑意,北京非遗兔儿爷的创新|环球通讯

俄罗斯国家原子能集团与国际原子能机构代表团举行磋商

聚焦:北京初步形成殡葬服务保障机制,文明低碳祭扫渐入人心

近10来首次!欧盟地产繁荣逆转,“央妈”立下警示牌

天天头条:今日清明

热讯:一年一清明 一岁一追思

百事通!又是清明雨上,愿所念之人无恙

缅怀英烈 | 雪域英雄路 天堑变通途_每日时讯

缅怀英烈 | 广大青少年致敬先烈 传承红色基因

乌克兰国家核电公司计划在夏季对乌核电站半数机组进行维护|天天播资讯

价值上亿元,9人因走私羚羊角、犀牛角受审

西班牙国防大臣:将在四月中下旬运送首批“豹2”坦克至乌克兰

外媒:英国苏格兰政府前首席大臣斯特金丈夫被捕

天天观天下!大学生银行卡里多了25万!“教科书级”操作来了

包钢赴敕勒川乳业开发区调研产业发展和重点项目推进情况

“小非农”携服务业PMI来袭,能否把黄金送上历史新高?

口罩能不能摘?哪些疾病高发?多地清明健康提示一文汇总 世界观速讯

凡人微光|他们,未曾远去-天天消息

要闻:英雄之光丨铭记挺身而出的藏蓝

美媒:特朗普被拘捕没拍“嫌犯照”,其竞选团队帮他P了一张

焦点短讯!英雄之光丨中国有多少条以英雄的名字命名的道路

卫星遥感、北斗定位、无人机巡航……“科技”赋能实现“数字”防火

最新快讯!国家级医疗质量控制中心名单公布,北京15家医院入选

热头条丨北京文投集团原党委书记、董事长周茂非被“双开”

观察:北京文投集团原总经理赵磊被“双开”

世界即时看!摩根大通首席执行官:美国银行业危机影响将持续数年

俄驻美使馆:美国宣布向乌提供新一批军事装备,将促冲突升级 热文

英雄之光 | “致敬·缅怀·奋进”2023年全国公安系统清明主题云诗会

技术π每周报告:黄金再度尝试上破 原油不宜做空!

谍战剧《薄冰》定档!重磅老戏骨把看点拉满 环球速看

人民公墓为扫墓群众准备9.8万枝鲜花,雨后清明,情深意浓

出逃不到2个月即落网!西安市粮食局原局长李西安被缉捕归案

焦点简讯:烈士墓碑文有误?检察官多方寻访真相

中国电科回应“员工痛批强制加班”:非集团公司所属成员单位和员工

“清明节的铭记”主题教育启动

热头条丨清明版《如愿》:春天很好,我好想您!

海淘的childlife大瓶钙含防腐剂?专家建议婴幼儿产品选购要谨慎

辽宁盘锦海事局:渤海北部盘锦港区一渔船失踪

菲律宾渡轮起火事故死亡人数上升至31人

智利发生大范围停电 30余万人受影响

俄媒:扎哈罗娃建议政治外交词典纳入新术语——“特朗普案”

清明祭英烈 |今天,为他们献花

天天观察:乌克兰总统泽连斯基访问波兰

环球热讯:网传中国电科员工痛批强制加班,四川省市两级总工会介入

每日短讯:考勤记录或微信聊天记录能证明加过班吗?

全球首富,换人了!

辽宁一渔船在渤海北部盘锦港区失踪,共有3人失联