AI 训练通常成本高昂,金额可能多达千万美元。上周五斯坦福大学、华盛顿大学、艾伦 AI 研究所以及 Contextual AI 的研究人员在预印本平台 arXiv 上发表了论文《s1: Simple test-time scaling》,提出了一种超低成本的 AI 训练方法,在 AI 社区引发了轰动。OpenAI 第一个提出了被称为 inference-time scaling laws(推理时间扩展定律)的方法,本质上指的是大模型在输出答案前如果“思考”更长时间那么就可能获得更高的性能。但无论是 OpenAI 还是 R1 都没有给出具体实现方法。在这篇论文中,研究人员给出了一种简单实现:在进行推理时用“等待”替换“停止思考”,迫使其继续思考进行第二次推理并核查第一次的答案。研究人员使用了一个小模型,将 56K 示例数据集筛选到 1K,这 1K 数据集足以在 32B 模型上实现 o1-preview 的性能,额外的数据不会提高性能。他们使用 16 个 NVIDIA H100 进行训练,每次运行 26 分钟,花了约 6 美元。
苹果面临反垄断调查
国家市场监督管理总局考虑对苹果发起反垄断调查。知情人士称,国家市场监管总局正在审查苹果的政策,其中包括对应用内消费收取最高 30% 的提成,禁止外部支付服务和应用商店。国家市场监督管理总局去年已经与苹果高管和应用开发者进行了交谈,它认为苹果可能向开发商收取了不合理的高额费用。这些谈判源自苹果就应用商店政策与腾讯和字节跳动等开发商之间长期存在的纠纷。如果谈判顺利,市场监管总局可能不会正式采取行动。