
如何让大模子感知常识图谱常识?开云kaiyun中国官方网站
蚂蚁聚首实验室:期骗多词元并行量度给它"上课"。
大说话模子的速即发展冲突了很多天然说话处理任务间的壁垒。通常情况下,大说话模子以量度下一个词元(Token)为教师标的,这与很多天然说话处理任务至极契合。
但关于常识图谱而言,实体算作最基本的数据单位,通常需要多个天然说话词元才气准确描写,这导致常识图谱与天然说话之间存在明显的粒度不匹配。
为了责罚这一问题,蚂蚁团队提倡了一种基于大说话模子的多词元并行量度法子 K-ON,其期骗多词元并行量度机制草率一次生成对通盘实体的评估散伙,进而达成说话模子实体层级的对比学习。

其散伙收录于 AAAI 2025 Oral。论文一作当今在浙江大学攻读博士。
实验散伙标明,本文法子在多个数据集上的常识图谱补全任务中均优于现存法子。
基于多词元并行量度的实体对比学习
词元是说话模子所能处理的最基本元素,通常需要数个词元组成的文本标签才气准确描写和辩认常识图谱中的实体。天然为每个实体创建一个新的词元并在微调过程中学习这些词元的暗意不失为一种替代有规划,但这种形式教师调优老本较高,且可能会对大模子的性能产生负面影响,通用性也受到截止。
本文探讨了如何高效期骗多个词元描写常识图谱中的实体以责罚常识图谱干系问题的法子。领先,径直优化经典的序列量度蚀本可能会导致大模子穷乏对常识图谱实体的意识,从而出现生成常识图谱中不存在的实体的问题;且研究到常识图谱中实体的数目,将通盘实体以文本险峻文的形式输入给大模子昭着亦然不实践的。

以上图为例,假定任务是给定不无缺三元组以量度标的实体 Matt Damon。左图中使用老例一语气单词元量度形式生成散伙需要多个子法子,且无法径直处理多个实体。因此,现存大大批常识图谱干系法子仅将大模子应用于浅易任务上,如考证三元组的正确性或从有限数目的候选实体中领受正确谜底。
比较之下,本文提倡的 K-ON 法子使用 K 个输出层并行量度多个实体不同位置词元的概率,这与当今 DeepSeek 等大模子中使用的多词元量度时候有着一定的相似性,且本文法子进一步借助了实体层级的对比学习在模子输出层上累加常识图谱常识。
K-ON 完成常识图谱补全任务的法子论
如下图所示,K-ON 并行评估常识图谱候选实体分数的过程可分为五步:

( 1 ) 与现存微调大模子的法子相似,K-ON 将常识图谱补全问题以文本请示的形式输入大模子;
( 2 ) 经大模子 Transformer 模块处理后的输出景况被输入至 K-ON 模块中,该模块由多个原大模子输出层 MLP 组成,对应为要量度实体的不同位置的词元;
( 3 ) 接着,K-ON 使用 Conditional Transformer 羼杂不同位置的信息,并研究到词元前后的端正依赖性;
( 4 ) 然后,使用低秩相宜时候(LoRA)将原大模子评分层构造为 K 个新的评分层,从而把上一步的输出散伙出动为对实体 K 个一语气词元的概率量度分散;
( 5 ) 临了便不错从不同位置的概率量度分散中抽取各实体词元对应的概率值,进而一次评估通盘候选实体的分数。
在获得候选实体分数后,便可使用常识图谱暗意学习规模中最为常用的对比学习蚀本使大模子掌执常识图谱中实体的分散:

此处 pe、 pej 离别代表正样本和负样本的分数,均由 K-ON 模块并行生成。除了实体层级的对比学习外,本文还进一步研究使用词元序列对皆使多词元并行量度的散伙与正本大模子单步一语气量度的散伙不时近。为达成这一标的,本文领先引入常用的单步量度蚀本以在教师语料上微调原输出层参数:

这里的下标 k 指代组成实体的词元的序号。
接着便可令 K-ON 模块中一次评估的 K 个词元的概率分散与老例一语气单词元量度得到的 K 个概率分散对皆:

此处上标 k-on、llm 离别指代 K-ON 和老例一语气量度所得到的分数。
临了,教师 K-ON 完成常识图谱补全任务的基本经过可追忆如下:

实验散伙:服从更高、老本更低、成果更好
下表展示 K-ON 在常识图谱补全任务上的实验散伙,除传统法子外,本文还与雷同基于大模子的法子以及多模态法子进行了比较。不丢丑出,K-ON 在所稀有据集及倡导上均取得了优于现存法子的散伙,且与一些使用罕见图像数据的法子比较,仍具有一定上风。

下图中进一步分析了 K-ON 中跟着 K 值的增多,模子各方面性能的变化,这里 K 的取值径直决定了单个实体最多不错由几许词元抒发。如图所示,当 K 取值过小时,由于抒发智商不及,K-ON 取得的实验散伙很差,但增多至 8 以后带来的性能栽种已不明显,而模子可教师参数目却稳步飞腾。
值得防卫的是,推理所用单步时分及总教师时分受 K 值影响不大,这诠释了 K-ON 多词元并行量度的高效性。

不仅如斯,本文还对 K-ON 所达成的实体层级的对比学习进行了分析,如下图所示。不错看出,在真的分歧教师服从形成影响的前提下,K-ON 可松驰达成波及上千个负样本实体的对比学习,但负样本数目并不是越多越好,将其设为 128 个足下便可取得最优散伙。

本文提倡了一种多词元并行量度法子,通过实体层级的对比学习使大模子草率感知常识图谱常识。充分的实验散伙标明,本文法子在常识图谱干系任务上具有权贵性能上风,何况较老例大模子有规划具有更高的教师与推理服从。
论文地址:
https://arxiv.org/pdf/2502.06257
蚂蚁有 18 篇时候论文被收录
当地时分 2 月 25 日,AAAI 2025 将在好意思国宾夕法尼亚州费城举办,会议为期 11 天,于 3 月 4 日收尾。AAAI 由海外东谈主工智能促进协会把持,为东谈主工智能规模的顶级海外学术会议之一,每年举办一届。AAAI 2025 共有 12957 篇灵验投稿,托付 3032 篇,考中率为 23.4%。
蚂蚁有 18 篇时候 Paper 收录,其中 3 篇 Oral,15 篇 Poster,磋议规模波及增深广模子隐秘保护、提高推理速率与推贤达商、栽种大模子教师服从、镌汰模子幻觉等。
— 完 —
投稿请职责日发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿实质
附上论文 / 步田主页贯穿,以及筹划形式哦
咱们会(尽量)实时回报你

一键暄和 � � 点亮星标
科技前沿认知逐日见
一键三连「点赞」「转发」「留心心」
接待在批驳区留住你的思法!开云kaiyun中国官方网站
XINWENZIXUN
林志玲和老公玄色良平带着女儿沿途去新加坡的大师旅行玩,林志玲穿短裤打扮的像二十明年的小密斯,她老公满脸胡子很暧昧,他比林志玲小七岁,然而看着更显老。 林志玲穿戴灰色T恤搭配淡色牛仔短裙,她戴了一顶后头是绿色丝绒蝴蝶结的凉帽,她的背影看着像20几岁的小密斯。林志玲推着婴儿车,老公黑泽良平牵着女儿的手,一家三口同框很温馨。 林志玲穿了一对六千块的Velentino的平底理会鞋,她的腿又细又长,她穿平底鞋看着和她长幼吏未几高,林志玲扫数东说念主很纤细修长。林志玲最近平淡出咫尺各大电影节、前锋算作上,
裁剪:揭芷雨 核定:吴瑕 核发:王国明 ——传播时髦 引颈风俗——开云(中国)开云kaiyun·官方网站 发布于:北京市
在这个高贵喧嚣、五彩斑斓的宇宙里,偶尔会清楚馅那么一些身影,他们不仅在各自的范围展现出寥落的才华,以致他们的外貌与肉体也令世东说念主自在。而今天,我想要说起的,就是这么一位令东说念主叹为不雅止的存在——王澜霏。 王澜霏的形貌宛如洋囝囝般雅致,她的五官如同匠东说念主全心雕琢的艺术品,处处都散漫着竣工的气味。她的眼眸犹如黑曜石般耀眼着智谋的光辉,红润的嘴唇如同樱桃般娇嫩。无论是怡然浅笑,也曾千里念念高远,她都巧合以独到的魔力令在场之东说念主心思恍惚。而她的肌肤则更是如雪般雪白,在职何期间她都如同盛
据新华社开云(中国)开云kaiyun·官方网站,巴基斯坦酬酢部发言东说念主塔希尔·安德拉比24日说,好意思国和伊朗的本领性研究将于本月30日归附。 举报 关系阅读 盘前必读丨好意思伊研究仍处于暂停情状;深交所史上最大范围IPO来了 机构合计,短期来看,商场聚焦有望向半年报功绩考据歪斜。 35268 06-22 08:01 王涵:好意思伊条约背后的各方得失与落地隐患 举座而言,这是多极治安的一次胜利,对好意思元金钱产生信心冲击。 3431 06-17 12:50 巴基斯坦总理:瞻望好意思伊条约将
1978年邓小平点名月旦上海市委文告,华国锋:不要怕,打不倒 1955年,中国东说念主民解放军瓦解引入了军衔体系。在此体系框架内,那些在地皮翻新干戈、抗日干戈以及解放干戈中成立超卓的将领们,均赢得了他们应得的尊容。遗弃1958年,共有57位解放军高等将领荣获上将军衔,他们被誉为“开国上将”。 在这57位开国上将之中,苏振华同道是独逐个位曾担任上海市委文告的要员。今天,让咱们一同追溯苏振华将军那听说般的一世。 1912年,苏振华在湖南省平江县三墩戴家铺的穷困农家出身。早年,他无缘正规老师,自幼便