LongCat-Video-Avatar是什么LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和
VTP是什么VTP(Visual Tokenizer Pre-training)是MiniMax视频团队开源的视觉生成模型预训练框架。框架聚焦优化视觉tokenizer,通过融合对比学习、自监督学习和
TRELLIS.2是什么TRELLIS.2是微软开源的40亿参数3D生成模型,专为从单张图片高效生成高保真3D资产设计。核心创新在于采用O-Voxel稀疏体素架构,能处理复杂拓扑结构(如开放表面、非流
GPT-5.2-Codex是什么GPT-5.2-Codex 是 OpenAI 推出的智能体编程模型,专为复杂软件工程和防御性网络安全设计。模型是 GPT-5.2 的升级版,提升了指令遵循、长语境理解等
EcomBench是什么EcomBench 是通义实验室联合 SKYLENAGE 推出的针对电商场景的 AI 能力评测基准。EcomBench 基于真实世界数据构建,涵盖政策咨询、成本估算、选品决策等
Kairos 3.0是什么Kairos 3.0(开悟世界模型3.0)是大晓机器人推出的行业首创的ACE具身研发范式、首个开源且商业应用的世界模型。Kairos 3.0是开源的高效世界基础模型,专注于学
FunctionGemma是什么FunctionGemma 是谷歌开源的专注于函数调用优化的轻量化AI模型,参数量为 2.7 亿。模型基于 Gemma 3 架构,专为在手机、浏览器等端侧设备上运行而设
T5Gemma 2是什么T5Gemma 2 是谷歌开源的新型端侧多模态长上下文编码器 – 解码器模型。模型回归优化了经典 Transformer 架构,引入绑定词嵌入和合并注意力机制等创新,参数规模有
千问App发布“2025十大AI提示词”榜单,揭示了2025年人们使用AI的十大高频场景,其中问得最多的三类问题为股票、八字和情感咨询。本次入选的十大高频提示词分别为:股票、八字、情感咨询、朋友圈文案
近日,高德地图正式上线3D收费站功能,实现全国164座城市核心收费站的全面覆盖。该功能通过高精度3D建模技术,精准还原收费站的车道布局、安全岛、收费亭等全要素细节。用户驾车接近收费站时,导航界面会自动