viva la vida

Saturday, March 22, 2025

腾讯混元T1：推理模型新势力，开启信息获取新时代

在人工智能的模型世界里，o1、R1等推理模型一直备受争议。有人钟情于它们能展现思考过程，助力自主判断答案正误并学习原理；有人却因它们思考速度慢、多轮对话耗时久，对其兴致缺缺。那么，有没有一款速度快、质量优且能高效处理大段长文本的模型呢？腾讯混元T1的正式上线，似乎给出了答案。

腾讯混元T1堪称六边形选手，在多个关键领域表现卓越。中文能力超越DeepSeek R1，在复杂推理以及代码任务方面优于o1。其响应速度令人惊叹，首字符1秒内响应，大约是R1的8倍，o1 - mini的2倍。生成速度可达60 - 80 tokens/秒，平均下来是R1、o1的3 - 4倍。在llm.hunyuan.tencent.com/#/chat/hy - t1即可直接体验。

从实际测评来看，混元T1成绩斐然。在大模型竞技场中，其基础模型Turbo S已挺进前15，超过o3 - mini。博主从联网搜索和将PDF一键转成可视化网页这两个常用场景对T1进行实测。T1开放了兼容OpenAI格式的API，方便众多API客户端使用。以联网搜索为例，当提问“昨天OpenAI发布了什么？”，T1能精准利用时间筛选网页信息，与R1对比，二者都能给出完整的模型列表、API费用信息和技术升级点等内容。此外，T1即将上线元宝，元宝能整合公众号文章信息，且依据信息相关度而非热度检索，能挖掘冷门但有用的信息。这将进一步优化博主的AI搜索工作流，或许会让Perplexity在工作流中的地位退居二线。

在代码能力方面，T1同样表现出色，思考速度快，生成的网页虽风格朴素但功能齐全。此前将文本转成可视频网页这一任务，许多模型难以稳定实现，而T1的表现值得期待。在价格方面，混元T1 API输入每百万tokens仅1元，输出每百万tokens为4元，性价比极高，是o1 pro的千分之一、o1的百分之一、DeepSeek R1的四分之一，文心大模型X1的二分之一。

那么，为何推理模型愈发受到关注？以GPT4.5为例，基础模型性能提升现阶段近乎触及瓶颈，计算量是GPT4的10倍，基础测试却仅比上一代4o提升5%。与此同时，推理模型o3 - mini在AIME2024（数学）测试集里，成绩超出GPT4.5近50个点。腾讯为提升速度，在混元T1中采用Hybrid - Mamba - Transformer融合模式，首次将混合Mamba架构无损应用于超大型推理模型。传统GPT系列的Transformer结构在处理长文本时，计算和内存需求会二次增长，而Mamba架构更适合处理长序列数据，在生成阶段内存和计算需求恒定，支持更长上下文。

混元T1的出现，让我们看到了更多可能性。或许未来，T1加上o1同款的Deep Research或者Grok3同款的Deeper Search后，凭借超快输出速度和超低API价格，在AI联网搜索尚未完全取代传统搜索之时，就实现由推理模型支持的深度搜索对其取而代之，重塑信息获取形式。各位读者，不妨前往体验一番腾讯混元T1，感受推理模型新势力带来的震撼，也期待在评论区分享您的使用体验。

viva la vida

Saturday, March 22, 2025

No comments:

Post a Comment