欢迎访问 [筑砼匠] ,
我们努力分享有用的专业知识。

研究人员提出一种超低成本的AI训练方法&苹果面临反垄断调查

研究人员提出一种超低成本的AI训练方法

AI 训练通常成本高昂,金额可能多达千万美元。上周五斯坦福大学、华盛顿大学、艾伦 AI 研究所以及 Contextual AI 的研究人员在预印本平台 arXiv 上发表了论文《s1: Simple test-time scaling》,提出了一种超低成本的 AI 训练方法,在 AI 社区引发了轰动。OpenAI 第一个提出了被称为 inference-time scaling laws(推理时间扩展定律)的方法,本质上指的是大模型在输出答案前如果“思考”更长时间那么就可能获得更高的性能。但无论是 OpenAI 还是 R1 都没有给出具体实现方法。在这篇论文中,研究人员给出了一种简单实现:在进行推理时用“等待”替换“停止思考”,迫使其继续思考进行第二次推理并核查第一次的答案。研究人员使用了一个小模型,将 56K 示例数据集筛选到 1K,这 1K 数据集足以在 32B 模型上实现 o1-preview 的性能,额外的数据不会提高性能。他们使用 16 个 NVIDIA H100 进行训练,每次运行 26 分钟,花了约 6 美元。

苹果面临反垄断调查

国家市场监督管理总局考虑对苹果发起反垄断调查。知情人士称,国家市场监管总局正在审查苹果的政策,其中包括对应用内消费收取最高 30% 的提成,禁止外部支付服务和应用商店。国家市场监督管理总局去年已经与苹果高管和应用开发者进行了交谈,它认为苹果可能向开发商收取了不合理的高额费用。这些谈判源自苹果就应用商店政策与腾讯和字节跳动等开发商之间长期存在的纠纷。如果谈判顺利,市场监管总局可能不会正式采取行动。
赞(0) 打赏
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权。
文章名称:《研究人员提出一种超低成本的AI训练方法&苹果面临反垄断调查》
本站资源仅供个人学习交流使用,请于下载后24小时内删除,不允许用于任何商业用途,否则法律问题自行承担。

评论/留言 抢沙发

筑砼匠_筑之所道,匠心天成。

筑砼匠建筑结构工程博客是专注于建筑结构、土木工程、结构工程、钢结构、工程设计、工程管理、工程规范、考试考证、工程专业软件使用等工程领域的技术型知识分享博客。

关于本站隐私政策

觉得文章对你有用就扫码赞助一下本站吧O(∩_∩)O~。

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起构建更加和谐的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册

Search
软件
主页
建筑
土木