腾讯混元T1:推理模型新势力,开启信息获取新时代
在人工智能的模型世界里,o1、R1等推理模型一直备受争议。有人钟情于它们能展现思考过程,助力自主判断答案正误并学习原理;有人却因它们思考速度慢、多轮对话耗时久,对其兴致缺缺。那么,有没有一款速度快、质量优且能高效处理大段长文本的模型呢?腾讯混元T1的正式上线,似乎给出了答案。
腾讯混元T1堪称六边形选手,在多个关键领域表现卓越。中文能力超越DeepSeek R1,在复杂推理以及代码任务方面优于o1。其响应速度令人惊叹,首字符1秒内响应,大约是R1的8倍,o1 - mini的2倍。生成速度可达60 - 80 tokens/秒,平均下来是R1、o1的3 - 4倍。在llm.hunyuan.tencent.com/#/chat/hy - t1即可直接体验。
从实际测评来看,混元T1成绩斐然。在大模型竞技场中,其基础模型Turbo S已挺进前15,超过o3 - mini。博主从联网搜索和将PDF一键转成可视化网页这两个常用场景对T1进行实测。T1开放了兼容OpenAI格式的API,方便众多API客户端使用。以联网搜索为例,当提问“昨天OpenAI发布了什么?”,T1能精准利用时间筛选网页信息,与R1对比,二者都能给出完整的模型列表、API费用信息和技术升级点等内容。此外,T1即将上线元宝,元宝能整合公众号文章信息,且依据信息相关度而非热度检索,能挖掘冷门但有用的信息。这将进一步优化博主的AI搜索工作流,或许会让Perplexity在工作流中的地位退居二线。
在代码能力方面,T1同样表现出色,思考速度快,生成的网页虽风格朴素但功能齐全。此前将文本转成可视频网页这一任务,许多模型难以稳定实现,而T1的表现值得期待。在价格方面,混元T1 API输入每百万tokens仅1元,输出每百万tokens为4元,性价比极高,是o1 pro的千分之一、o1的百分之一、DeepSeek R1的四分之一,文心大模型X1的二分之一。
那么,为何推理模型愈发受到关注?以GPT4.5为例,基础模型性能提升现阶段近乎触及瓶颈,计算量是GPT4的10倍,基础测试却仅比上一代4o提升5%。与此同时,推理模型o3 - mini在AIME2024(数学)测试集里,成绩超出GPT4.5近50个点。腾讯为提升速度,在混元T1中采用Hybrid - Mamba - Transformer融合模式,首次将混合Mamba架构无损应用于超大型推理模型。传统GPT系列的Transformer结构在处理长文本时,计算和内存需求会二次增长,而Mamba架构更适合处理长序列数据,在生成阶段内存和计算需求恒定,支持更长上下文。
混元T1的出现,让我们看到了更多可能性。或许未来,T1加上o1同款的Deep Research或者Grok3同款的Deeper Search后,凭借超快输出速度和超低API价格,在AI联网搜索尚未完全取代传统搜索之时,就实现由推理模型支持的深度搜索对其取而代之,重塑信息获取形式。各位读者,不妨前往体验一番腾讯混元T1,感受推理模型新势力带来的震撼,也期待在评论区分享您的使用体验。
No comments:
Post a Comment