起首:机器之心Pro
AIxiv专栏是机器之心发布学术、本领内容的栏目。往时数年,机器之心AIxiv专栏吸收报谈了2000多篇内容,隐敝众人各大高校与企业的顶级实践室,灵验促进了学术交流与传播。淌若您有优秀的使命想要共享,迎接投稿大概干系报谈。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
本文第一作家为毕业于马里兰大学计较机系的博士胡正冕,其导师为 Heng Huang。他的主要斟酌场所是采样与机器学习表面,曾在 ICML、NeurIPS、ICLR、EMNLP 等顶会上发表多篇论文。邮箱: huzhengmian@gmail.com近日,DeepMind 团队将水印本领和投契采样(speculative sampling)长入,在为大讲话模子加入水印的同期,普及其推理效力,镌汰推理老本,因此顺应用于大领域分娩环境。这项斟酌发表在了 Nature 杂志上,给出了两种具体的长入当作,别离在水印检测效力和生成速率上达到了现存最优水平,但无法同期兼顾两者。无稀疏偶,另一组来自马里兰大学的斟酌东谈主员针对团结个问题进行了表面角度的深入分析。他们发现了一个「不能行」定理,证明了不存在一个算法不错同期达到最优的推理效力和最高的水印强度。因此,任何水印系统王人必须在这两个观点之间进行量度。这项名为「Inevitable Trade-off between Watermark Strength and Speculative Sampling Efficiency for Language Models」的斟酌已被 NeurIPS 2024 会议吸收。
论文地址: https://arxiv.org/pdf/2410.20418
代码仓库: https://github.com/xiaoniu-578fa6bff964d005/AcceleratedUnbiasedWatermark
无偏水印与投契采样当作无偏水印当作 [1] 是一种将水印镶嵌到生成文本的本领,它在表面上保证不影响生成文本的质地和千般性,并让水印无法被东谈主察觉。这种水印当作可用于版权保护和起首追踪。其中枢念念想是在生成历程中对候选 token 的概率进行重新加权,并要求诊治后的概率散播在对水印的随即私钥进行平均后,在数学渴望上与原始散播疏通,从而幸免引入偏差。投契采样当作 [2,3] 是一种加快大讲话模子推理的本领。此当作欺诈较小的草稿模子快速生成草稿序列,再通过观点模子对这些草稿进行考证和修正。草稿模子领域较小,生成速率更快但质地较低;观点模子并行进行考证,领受符合条目的部分。这种当作不错在保执生成质地的同期,显赫普及推理效力,镌汰计较老本,已成为大领域应用中不能或缺的器用。「不能行」定理斟酌者建议了一个两次重加权框架,别离对草稿模子和观点模子的输出散播进行重加权。这个框架具有很高的目田度,两次重加权函数不错不同,考证算法也不错纵容聘任,只好悠闲最终算法保执输出概率散播,从而看守输出质地即可。在此框架下,斟酌者严格神志并证明了一个「不能行」定理:当词汇表大小大于 2 时,任何试图同期保执水印强度和加快效力的当作王人势必使用两个粗浅的重加权函数。
这个定理揭示了水印强度和投契采样效力之间存在一个不能幸免的量度,必须在两者之间作念出聘任。任何潜在的当作王人无法同期达到在不琢磨加快情况下最佳的水印本领的检测效力,和在不琢磨水印情况下最佳的投契本领的加快效力。此扫尾也为畴昔的斟酌指明了场所:在联想新算法时斟酌者需要琢磨这个表面铁心,凭据应用需求在两个观点之间进行均衡。两种长入当作即便「不能行」定理揭示了水印强度和采样效力之间存在不能幸免的量度,此斟酌给出了两种具体的长入水印和投契采样的当作,使得其别离悠闲以下两点性质:1.保执水印强度的当作优先确保水印的可检测性,即使这可能会就义一定的采样效力。这种当作当先对观点模子和草稿模子的输出概率散播进行重加权并从中采样,然后基于两个重加权散播进行投契采样。2.保执采样效力的当作优先保证生成速率,即使水印的强度可能有所镌汰。这种当作仍然对观点模子和草稿模子的输出概率散播进行重加权并从中采样,但接下来基于两个未经过重加权的散播进行投契采样。这两种当作体现了不同的选用,使用者不错凭据具体应用场景和需求进行聘任。实践扫尾斟酌东谈主员在多种文本生成任务以及多种讲话模子上进行了实践。他们引入了两个筹算:平均每步领受的 token 数(AATPS)推测投契采样效力,每个 token 的平均负对数 P 值(ANLPPT)推测水印强度。
实践扫尾考证了表面分析的正确性,证明了水印强度和采样效力之间如实存在量度。保执水印强度的当作在水印强度上与传统无偏水印当作十分,但采样效力比较原始投契采样当作有所着落;保执采样效力的当作在采样效力上与原始投契采样当作十分,但水印强度有显著镌汰。这标明凭据内容需求,不错聘任优先保证水印强度或采样效力的战略。转头此斟酌从表面角度证明了水印可检测性和投契采样效力之间存在根蒂龙套,这种龙套并不仅限于当今已有的当作,而是一个多量划定。鉴于投契采样还是成为镌汰推理老本不能或缺的器用,高可检测水印系统领来的推理老本加多在畴昔将执续存在。将水印本领与投契采样长入这个当作固然不错让水印更接近实用,但同期也可能带来一些伦理问题,如未经深刻的追踪当作。在内容应用中,东谈主们应当严慎、相宜伦理地应用无偏水印当作,并向用户明确说明其存在,使命旨趣和真理。[1] Unbiased Watermark for Large Language Models[2] Fast Inference from Transformers via Speculative Decoding[3] Accelerating Large Language Model Decoding with Speculative Sampling