transformers - 搜索 News

资讯

十轮网科技资讯 on MSN1 天

Google开源Gemma 3 270M，挑战低资源部署

Google周四（8/14）开源Gemma 3 270M，这是Gemma系列中最轻量的版本，具备2.7亿参数，它在Pixel 9 Pro上执行25轮对话仅耗0.75%电量。该模型专为特定任务微调与设备端部署设计，具备指令遵循与文本结构化能力，而非通用 ...

3 天

谷歌开源 Gemma 家族最轻量模型 Gemma 3 270M

IT之家 8 月 16 日消息，谷歌宣布旗下开源旗下 Gemma 系列家族中最轻量的版本“Gemma 3 270M”，该模型拥有 2.7 亿参数，主要面向端侧部署场景，具备指令遵循和文本结构化能力。

4 天

FuriosaAI发布UNCAGE：AI图像生成迈向精准物体辨识新纪元

markdown 近日，韩国FuriosaAI公司联合首尔国立大学的研究团队在计算机视觉顶级会议上发表了名为“UNCAGE: Contrastive Attention Guidance for Masked Generative ...

13 天

硬件与应用同频共振，英特尔Day 0适配腾讯开源混元大模型

今日，腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局，现已在英特尔?酷睿? Ultra平台上完成针对该模型的第零日 (Day ...

凤凰热榜1月

停止RL研究，前OpenAI研究员：互联网才是唯一重要的技术

07/15 18:12 关注新茶饮行业趋势，了解各品牌产品上新信息。来自北京市强化学习（RL）被认为是实现通用人工智能（AGI）的必要一环。然而，在前 OpenAI 研究员 Kevin Lu 看来，当前的 RL 难以实现「从 GPT-1 到 GPT-4」般的重大突破，应该“停止进行 RL 研究，转而从事产品开发”。他的理由简洁明了：推动人工智能（AI）实现大规模转变的技术是互联网，而不是 ...

腾讯网3月

逐步理解 Transformers 的数学原理_腾讯新闻

逐步理解 Transformers 的数学原理数据汪 2025-05-05 12:03 发布于海南科技领域创作者 + 关注 ...

IT之家11月

微软被曝正开发 2 款新《变形金刚》游戏，将于今年发行

IT之家 9 月 3 日消息，网友 Silver Optimus 于 9 月 1 日在游戏论坛 TFW2005 上发帖，透露微软工作室正在研发两款《变形金刚》（Transformers）游戏。消息源并未透露更多的细节，仅透露这两款游戏内部代号就叫 Transformers，计划于 2024 年发行。《变形金刚》相关游戏包括：《变形金刚：赛博坦之战 ...

51CTO1 年

目标检测新方式 | class-agnostic检测器用于目标检测-51CTO.COM

本文经计算机视觉研究院公众号授权转载，转载请联系出处。一、简要目标检测模型在定位和分类训练期间显示目标时表现良好，然而，由于创建和注释检测数据集的难度和成本，训练过的模型检测到数量有限的目标类型，未知目标被视为背景内容。这阻碍了传统检测器在现实应用中的采用，如大 ...

GitHub2 年

大模型的权重共享实现——transformers是如何实现大 ...

大部分nlp模型的权重共享，主要就是共享的是embedding和lm_head层的权重。我们来看看，transformers是如何实现的。因为已经是看完了完整的代码，总结起来就是这样：在模型初始化的时候，跳过对lm_head权重的加载. 将embedding的weight复制给lm_head的weight. 利用的就是pytorch的nn.Parameter对象的能力. 虽然道理 ...

中国科学院11 年