资讯

陈丹琦团队提出了「KV 足迹」作为一种统一的度量标准,它是在所有时间步中,未被逐出的键值缓存条目所占比例的聚合值。 普林斯顿大学计算机科学系助理教授陈丹琦团队又有了新论文了。 近期,诸如「长思维链」等技术的兴起,带来了需要模型生成数万个 ...
用Sanaka AI的新方法训练出的7B小模型,在传授推理技能方面,比671B的DeepSeek-R1还要有效。 这个方法要求教师模型像优秀的人类教师一样,根据已知解决方案输出清晰的逐步解释,而不再是从头开始自己解决。 用Sanaka AI的新方法训练出的7B小模型,在传授推理技能 ...
在如今这个人工智能飞速发展的时代,大语言模型(LLMs)正以前所未有的速度更新换代。从最初的简单对话生成,到如今能够处理复杂指令、参与多领域任务,这些模型正逐渐成为我们生活中不可或缺的助手。然而,随着应用场景的不断拓展,人们对于模型的 ...
为了解决上述挑战,北京大学、MIT等机构的研究人员提出了「合成数据强化学习」(Synthetic Data RL)框架。这是一个简单而通用的框架,仅从一个任务定义出发,合成大量多样的领域特定样本,然后利用强化学习(RL)对模型进行微调。
此前3月份发布的Gemini Robotics虽然性能强大,但需要依赖云端计算。而这次的On-Device版本,直接把AI塞进了机器人的“大脑”里,彻底解决了网络延迟和连接不稳定的老大难问题。
随着2025年6月中东地区冲突加剧,网络行动的强度和范围也同步扩大。Group-IB威胁情报部门最新报告揭示了一幅复杂的图景:黑客活动浪潮、针对性网络攻击和电子战交织——其中部分行动已对关键基础设施和民众安全造成实质性影响。
ab 是 Apache Bench 的缩写,是 Apache 提供的一个开源压力测试工具。本文将详细介绍 ab 命令的功能、安装方法、使用技巧以及结果分析。 在Web服务器性能调优和系统压力测试中,ab 命令是一个非常实用且高效的工具。它不仅可以对 ...
这是来自UC伯克利、卡内基梅隆大学等团队的最新研究成果LeVERB框架。 基于模拟数据训练实现零样本部署,让人形机器人通过感知新环境,理解语言指令就能直接完成全身动作。 传统人形机器人要么 “能看懂指令却动不了”(缺乏全身控制能力),要么 “只能 ...
https://www.theinformation.com/articles/openai-quietly-designed-rival-google-workspace-microsoft-office?rc=epv9gi ...
只要出现一个更合理、可集成性强的替代方案,我会毫不犹豫地彻底换掉 MCP。企业领域很多人想法都一样——毕竟我们花了几十年构建完善的 API 管理系统,而 MCP 把这一切都搞乱了。 完全同意,虽然我理解 MCP 在用户端工具方面的价值,但很多人似乎是在“重新造轮子”,因为他们根本不懂 REST。用 LLM 发起一个定义良好的 REST 请求,其实并不难。
操作 Windows 程序、自动对账发票、预订航班和酒店——这些只是新一代大型语言模型(LLMs)为 AI 智能体带来的众多可能性中的几个。研究人员将这一阶段的进化称为“大型行动模型(Large Action Models)”,简称 LAMs。 迄今为止,LLM 是无状态的——它们无法自行采取行动、适应环境或与工具交互。但 LAMs ...
当大型语言模型(LLM)面对外部反馈,它们能否像人类学生那样彻底蜕变?还是会被反馈阻力(FEEDBACK FRICTION)绊倒?本文将带你直面LLM的自我改进瓶颈,探寻AI认知边界与未来突破的可能,揭示一个令人不安却引人深思的现实。 大家好,我是肆〇柒。在 AI 领域 ...