本欄目由 36 克独家出品
本文来自界面新闻前几通用大模型价格战后四杰跳动又要把多摩泰大模型的价格打下来 12 月 18 日在火山引擎 Forestar 会上四杰跳动正式发布豆包视觉理解模型同时公布其售价为 1000 tokens 输入 0.003 元比行业平均价格便宜 85%相当于一元钱就可处理 284 张 720P 的图片这意味着
字节跳动在多摩泰大模型领域再次复制其在通用大模型领域大幅降价的打法今年 5 月 该公司正式对外发布豆包大模型并把价格降低了一个数量级引发了阿里 百度等多家厂商大模型的降价潮我山影景总裁谭代此前表示降低成本是推动大模型快进到价值创造阶段的一个关键因素
那年过去,豆包通用大模型在市场上的表现一定程度上验证了弹带的判断。字节跳动对外公布的数据显示,截至 12 月中旬,豆包通用模型的日均 Tokens 使用量已超过 4 万亿,较 7 个月前首次发布时增长了 33 倍。
大模型应用正在向各行各业加速渗透与界面新闻了解豆包大模型已经与八成主流汽车品牌合作并接入到多家手机 PC 等智能终端覆盖终端设备约 3 亿台来自智能终端的豆包大模型调用量在半年时间内增长 100 倍最近
最近三个月豆包大模型在信息处理场景的调用量增长了 39 倍客服与销售场景增长 16 倍硬件终端场景增长 13 倍 AI 工具场景增长 9 倍学习教育等场景也有大幅增长在此次发布会上谭代再次强调豆包大模型市场份额的爆发得益于火山引擎更强模型更低成本更易落地的发展理念
最新发布的豆包视觉理解模型大幅降价也基于同样的逻辑而字节跳动在多摩泰大模型上的野心还不止于此仍夺更多有 AIGC 需求的客户字节跳动方面称豆包视觉理解模型不仅能精准识别视觉内容还具备出色的理解和推理能力可根据图像信息进行复杂的逻辑计算完成分析图表处理代码解答学科问题等任务
此外 单模型有着细腻的视觉描述和创作能力 例如 其可以一眼识别动物的影子 并推断出这是什么动物也可识别地标建筑生活中不太熟悉的物品 并给出科普信息 同时还可识别出图片中被全选位置的物体
豆包战略研究负责人周浩表示豆包一直试图让用户的输入更快更方便非常注重多模态的输入和打磨包括语音视觉等能力这些模型都已通过火山引擎开放给企业客户根据谈代的判断豆包视觉理解模型在判证指导作文批改儿童陪伴等教育场景目的地推荐外文菜单识别著名建筑识别及讲解等旅游场景
以及拍照找同款商品搭配建议广告种草文案等电商营销场景有较大的空间目前火山引擎已邀请数百家企业测试该模型和豆包视觉理解模型一同发布的还有豆包 3D 生成模型该模型与火山引擎数字孪生平台 V-Omiverse 结合使用据称可高效完成智能训练数据合成和数字资产制作成为一套支持 AIGC 创作的物理世界仿真模拟器
一面新闻记者在现场体验了用豆包 3D 生成模型生成一张桌子,输入相关参数,模型就可以生成相应的 3D 图像,还可以根据需求变换桌子的材质。爱装修设计、游戏、元宇宙等领域,该模型都可以很好的辅助设计人员进行创作。烈士字节跳动,在多模态大模型领域,更大的野心所在。
当多模态模型的技术能力更强 价格更便宜 即将会在更多场景以及更多对 AIGC 有需求的企业中使用同时 火山引擎升级了火山方舟 COS 和 HaiAgent 三款平台产品帮助企业构建自身的 AI 能力中心 提升开发 AI 应用的效率
其中火山方舟发布了大模型记忆方案并推出 prefix cache 和 session cache API 以降低延迟户成本火山方舟还带来全域 AI 搜索具备场景化搜索推荐一体化企业私域信息整合等服务批量更新大模型经模型发布的同时豆包此前发布的多款大模型也迎来更新
其中,豆包通用模型 Pro 以全面对齐 GPT-4O,只用价格仅为后者的八分之一,音乐模型从生成 60 秒的简单结构升级到生成三分钟的完整作品。生图模型 2.1 版本,首次实现精准生成汉字和一句话辟除的产品化能力。
明年春季 字节跳动还将发布具备更长视频生成能力的豆包视频生成模型 1.5 版豆包端到端实时语音模型也将很快上线从而解锁多角色演绎 方言转换等新能力相比于市场同类产品豆包西月大模型发布的时间并不算早
但一直保持较快速度的更新豆包系列大模型最新的能力也通过吉梦 AI 和豆包 APP 开放给了普通用户使用月初豆包网页版和豆包 APP 上线了图片理解功能
特示显示该功能可识别图片中包含的元素和基本特征同时用户还可通过该功能询问某景点所处的位置或某颗角色出自哪部影视作品利于字节字言的豆包文生图模型豆包视频生成模型即梦呆呆近期上线了三款视频生成模型并接入了最新的豆包文生图模型特示
特示显示用户可输入一句话一键生成海报海报中文字生成的准确率也大幅提升让图片创作编辑更加灵活一梦 AI 隶属于字节跳动旗下剪影业务于 2024 年 5 月上线定位是 AI 内容平台支持通过自然语言及图片输入生成高质量的图像及视频此前 街面新闻曾独家报道字节跳动旗下创作工具剪影和 TagCut
在 2024 年实现了超过三位数收入增长总收入正接近百亿元人民币同时剪映和 Tiaka 的全球月活用户也已经超过 8 亿目前字节跳动计划提升极梦的产品优先级尝试用新的路径打造 AI 时代的抖音这也意味着字节跳动对大模型在消费端产品落地还有更高的预期