你的位置:云开·全站APPkaiyun > 新闻资讯 > 开云kaiyun以《AI安全与“培养”之谈》为主题进行了演讲共享-云开·全站APPkaiyun

开云kaiyun以《AI安全与“培养”之谈》为主题进行了演讲共享-云开·全站APPkaiyun

时间:2024-11-03 05:24 点击:61 次

开云kaiyun以《AI安全与“培养”之谈》为主题进行了演讲共享-云开·全站APPkaiyun

衡宇 发自 更阑向阳

量子位 | 公众号 QbitAI

OpenAI酌量副总裁(安全)翁荔(Lilian Weng),现身国内!

还初次在国内大型举止场面公设备表AI主题演讲。

先简陋先容一下,翁荔是OpenAI华东谈主科学家、ChatGPT的孝顺者之一。

北大毕业后,翁荔在2018年加入OpenAI,其后在GPT-4姿色中主要参与预考研、强化学习&对皆、模子安全等方面的办事。

最知名的Agent公式也由她提议,即:Agent=大模子+追思+主动决策+器具使用。

在今晚的2024Bilibili超等科学晚举止上,翁荔站在舞台上,以《AI安全与“培养”之谈》为主题进行了演讲共享。

演讲并不十分渊博,主要以科普向为主,但深入浅出,先容了AI安全干系千般问题。

她暗意:

AI的安全不单是是酌量者的背负,它需要每一个东谈主的参与。

(以下是翁荔演讲全文,在不改变其应允的基础上略有删减。)

翁荔演讲全文

今天先与专家探讨一个既深切又敬爱的话题,「AI 安全」,以及「咱们若何像培养下一代一样,培育出理智又安全的东谈主工智能」。

ChatGPT横空出世以来,AI手艺如同搭乘了高速列车,赶快渗入并影响着咱们。

AI每天都在变化,需要咱们全心指点、教养,确保是更好的服务于东谈主类,同期确保安全。

一个既安全又智能的AI,无异于将为咱们的生计带来诸多裨益。

试想,一个知悉你生计风俗的智能家居系统,能凭证你的需求自动改革室内温度、光泽;或是一个时刻关注你健康情状的AI助手,能为你提领提供量身定制的健康AI。

这不仅能显耀莳植咱们的生计质地,还能开辟新的工作规模,莳植办事后果。

然则,这一切修复在AI安全的基础之上。

正如自动驾驶手艺一样,它能极地面莳植生计便利性,但是一朝出错,后果可能不胜设计。

跟着AI应用日益智化与自主化,若何确保AI的行动允洽东谈主类价值不雅,着实作念到以东谈主为本,成为了AI 安全与对皆酌量等中枢议题。

东谈主类在成长过程中会不绝学习杰出,但也会际遇成长的烦嚣。

相似的,AI可能因为偏见而变得短促,也可能因为对抗性膺惩而被坏心质疑,AI安全和对皆酌量智力使AI成长过程愈加顺利。

让咱们以健康规模为例。

许多疾病酌量的数据时常以男性的群体为主,这可能导致AI在处理女性的健康问题时风险评估不准确。

此外,数据自己也有可能存在偏见。

比如有酌量标明,女性腹黑病症状更容易被归结成躁急等神思问题,而形成会诊遗漏。

因此,咱们需要通过对AI安全和对皆酌量来减少偏见。

AI 学习的基础是数据,数据是它的食品。

要想让AI变得理智可靠,咱们必须确保它养分平衡,也便是提供它各种、全面、正确的数据,匡助它粗略正确地协调这个复杂的宇宙,并减少偏差。

在使用东谈主类象征的数据时,咱们不错依赖于群体聪慧,也便是合并个数据点被多东谈主标注。

挑升旨真谛的是, 1907年的一篇当然科学杂志中的著述,作家跟踪了一场年度博览会上的一个敬爱的有奖竞猜。

博览会上,东谈主们选出一头肥牛,让专家来料想牛的分量,最接近真实数据的东谈主将赢得大额的奖金。

作家发现,「最中间值」时常是最接近真实数据。

这个数预计值也被称为the voice of the people。

在这篇近120年前的科学著述中,作家转头谈:“我合计这个末端比东谈主们预期的更能讲明民主判断着实度。”

这亦然最早提到群体聪慧若何发生作用的科学文献。

而至于若何把高质地标注的数据给AI,则基于东谈主类响应的强化学习(RLHF)起到了关节作用。

在了解RLHF之前,咱们快速了解一下什么是强化学习(RL)。

强化学习是一种机器学习门径,它主要通过赏罚机制来让模子学会完成任务,而不是依靠顺利告诉模子若何去作念这件任务。

假想一下,就好像你考研小狗,淌若小狗作念对了一个动作,比如坐下,你就给他一块骨头饼干;作念错了就不给奖励。

这样,小狗就会因为想吃到更多的饼干而学会若何正确地坐下。

同理,AI也在这种赏罚机制中学习,通过不绝的尝试并得到响应,找到最好的服务政策。

一个早期的酌量标明,强化学习能利用小数东谈主类响应,快速灵验地教养智能体作念复杂的动作,学会若何后空翻。

相似的门径也不错用于考研大谈话模子(LLM)。

当咱们看到针对合并问题的不同AI回复时,咱们不错告诉模子哪一个回复更好、更正确、更允洽东谈主类价值不雅,这样咱们就像家长教养孩子一样,改革AI的学习过程。

此外,咱们还不错使用模子自己当作AI输出质地的评分者。

比如在Antropic发表的《Constitutional AI》中,模子就通过对我方行动的我评价进行校阅;或者在对皆强化学习中,咱们不错制定异常防备的行动规章来告诉AI,何时拒却用户的央求,若何抒发同理心等等。

然后咱们在强化学习的奖励机制中,异常精确地赐与相应的评分奖励。

这个过程中,一个愈加强盛的AI有智力更精确地判断它是否治服了东谈主类的价值不雅和行动准则。

强化学习手艺就像一把钥匙,匡助咱们大开AI高质地学习和发展的大门。

在培养AI更懂咱们的过程中,平凡东谈主也能施展遑急的作用。

在文档写稿上,咱们不错经受两个小手段。

领先,设定防备的配景和扮装想想,像导演为演员准备脚本一样让AI在丰富的情境中,捕捉咱们的意图。

其次,全心挑选关节词,构建逻辑新鲜的文档结构,使文档既好意思不雅又实用。

在视频音乐制作规模,咱们不错通过使用专科术语来指点AI,比如黄金分割构图或和弦进行,将创意篡改为履行。

同期,别忘了情谊的进入,因为这是赋予作品灵魂关节词。

简而言之,通过精采的指导和情怀的融入,咱们不错匡助AI创作出既丰富又敷裕感染力的作品。

在《西纪行》中,孙悟空有紧箍咒敛迹行动,咱们应该给AI模子也戴上了紧箍咒,也便是教养 AI 安全基本准媾和德步履,让其效劳行动法式,以东谈主类利益为先,成为咱们贴心的伙伴,而不是冰冷的机器。

让AI学习基本原则媾和德准则,不错使模子在濒临复杂问题期间骗推理得出正确的论断。

比如在OpenAI最近发表的Open-o1-preview模子中,咱们通过想维链(CoT)推理加强了模子的可靠性,使得模子不错更好地抗拒逃狱膺惩。

膨胀性酌量(scalable oversight)在AI对皆酌量中也异常遑急。

跟着AI模子扩大,需要结合自动化器具和东谈主类监督灵验的行动,确保它朝着正确的场所发展。

在一组公开酌量中,咱们用监督学习考研谈话模子对辘集文本概要进行月旦,比如提供“这个概要异常准确”,或者“这个概要遗落重点”。

比拟对照组,咱们发现存AI匡助的标注员比莫得匡助的能多找出概要中约50%的问题,况且多量参考了模子提供的实质。

总之,给AI设定步履并进行灵验监督,不错莳植它对东谈主们的匡助。

AI的安全不单是是酌量者的背负,它需要每一个东谈主的参与。

以B站为例,这个充满活力的社区辘集了宽广AI喜欢者、创作家,咱们在这里共享简陋、商榷问题,以至监督AI的推崇,共同影响着 AI 的成长。

咱们每个东谈主都应该成为AI的专家长。

AI 手艺是一把双刃剑,它带来的便利和挑战并行,咱们的参与至关遑急。

让咱们联袂培养出一个既理智又认真是AI伙伴。

感谢专家的凝听,但愿今天的共享引发专家对AI安全的景仰兴味,也感谢B站直播这个平台。

让咱们共同为AI的将来孝顺力量,谢谢。

OpenAI备受争议的安全之路

然则,OpenAI在安全这个场所的前进,却一直备受争议。

上周,一则“OpenAI散伙AGI磋磨团队”的音讯传遍全球。

源流是AGI Readiness团队认真东谈主Miles Brundage晓示去职。

他暗意,已在OpenAI完成所有办事,在外部办事将产生更大的影响。

将来他意见在OpenAI以外连接从事该规模酌量办事,并但愿减少偏见。

这不是OpenAI安全方面离开的独逐一个遑急东谈主物。

本年上半年,OpenAI团结创举东谈主、首席科学家Ilya Sutskever去职,他指示的“超等对皆团队”速即散伙。

该团队设立于2023年7月,OpenAI给了它一个办事:

用20%的算力,在将来4年内不休截止超等智能AI的中枢手艺挑战。

Ilya是这样解释我方离开OpenAI的原因的:

制造比东谈主类更理智的机器自己便是一项危机的行状。

OpenAI代表全东谈主类肩负着深广的背负。

但在当年几年里,安全文化和历程一经让位于闪亮的产物。

已然离开的还有“超等对皆”团队团结认真东谈主、安全垄断Jan Leike——他最终遴荐跳槽到OpenAI最强竞对、Claude背后团队Anthropic,连接超等对皆办事。

去职后,Leike对外爆料,最近几年OpenAI一经不吝里面文化,把“引诱眼球的产物”放在安全准则之前。

现时,翁荔无疑是是最前沿AI实验室的安全总认真东谈主了。

OpenAI的安全之路,又将走向何方?

— 完 —

量子位 QbitAI · 头条号签约

关注咱们开云kaiyun,第一时候获知前沿科技动态

新闻资讯

XINWENZIXUN

开云(中国)开云kaiyun·官方网站这场发布会真确激励行业飘荡的-云开·全站APPkaiyun

华为近日举办的新品发布会激励行业平素体恤,这次共推出三款重磅产物,其中两款为移动结尾建立。备受注成见第二代三折叠屏手机MateXTs不时了高端定位,而另一款8.8英寸平板手机MatePad mini则以亲民价钱回想商场,其悦读版3299元的起售价激励浪掷者热议。 对比华为现存产物线,MatePad mini的订价计策颇具冲击力。在疏通预算区间内,该机型较Mate70、Pura70/80尺度版及nova14 Pro等机型展现出更高性价比,尤其符合对影像功能需求不高的用户群体。这场发布会真确激励行

开云kaiyun2025年5月29日山东喜地农家具市集惩办有限公司价钱行情-云开·全站APPkaiyun

品种 最高价 最廉价 大批价 大白菜 1.01 0.97 1.00 油菜 2.31 2.28 2.30 生菜 2.51 2.48 2.50 菠菜 7.23 7.18 7.20 茼蒿 7.61 7.58 7.60 油麦菜 4.71 4.68 4.70 葱 3.24 3.19 3.20 胡萝卜 3.61 3.58 3.60 土豆 2.61 2.58 2.60 生姜 8.71 8.68 8.70 大蒜 5.61 5.58 5.60 芹菜 2.21 2.18 2.20 蒜薹 2.31 2.28 2.3

云开·全站APPkaiyun2025年5月29日山东凯盛外洋农居品物流城价钱行情-云开·全站APPkaiyun

品种 最高价 最廉价 大量价 特一粉 4.20 4.20 4.20 要领粉 4.00 4.00 4.00 甘蔗 4.40 3.00 3.70 大白菜 1.30 0.80 1.05 油菜 2.20 1.60 1.90 生菜 4.00 2.00 3.00 茼蒿 5.00 3.40 4.20 土豆 2.60 1.40 2.00 山药 8.00 4.00 6.00 大葱 2.00 1.60 1.80 生姜 7.00 4.00 5.50 莲藕 6.00 4.40 5.20 红萝卜 3.60 2.60 3

开云kaiyun官方网站2025年5月29日山东威海市农副居品批发市集价钱行情-云开·全站APPkaiyun

品种 最高价 最廉价 巨额价 大白菜 1.00 0.80 1.00 油菜 3.00 2.00 3.00 小白菜 2.40 1.60 2.40 菠菜 8.40 6.60 8.40 韭菜 3.00 2.00 3.00 洋白菜 1.40 1.20 1.40 胡萝卜 3.40 3.00 3.40 土豆 2.60 2.00 2.60 葱头 1.40 1.00 1.40 大葱 2.00 1.80 2.00 生姜 8.00 7.00 8.00 大蒜 13.00 5.40 13.00 芹菜 2.20 1.80

开云kaiyun四月的白羊仿佛被丘比特之箭掷中-云开·全站APPkaiyun

【小小故事博全球一乐!!!】 4月星座运势:白羊金牛等行状爱情双丰充攻略 四月的春风不仅吹绿了地面,也悄然间为白羊座和金牛座的一又友们带来了行状与爱情的双重机遇。你是否如故准备好,在这个充满但愿的季节里,获利满满的幸福与设立?让咱们一齐探索,如安在四月的星象指引下,让行状与爱情王人头并进,终了双赢! 白羊座的你,总所以那股子抗争不挠的冲劲,让东说念主印象深化。四月,你的行状宫将迎来一颗时髦的吉星,这意味着你的职场之路将变得愈加顺畅。不妨借此契机,主动承担更多的牵累,展现你的带领力和创新智商。记

回到顶部
关注公众号
联系我们
QQ:20993392588
邮箱:8098c723@outlook.com
地址:新闻资讯国际企业科技园574号

Powered by 云开·全站APPkaiyun RSS地图 HTML地图


云开·全站APPkaiyun-开云kaiyun以《AI安全与“培养”之谈》为主题进行了演讲共享-云开·全站APPkaiyun