当前位置:首页探索>统一多模态了解和生成字节 Se模型 BAed 开源

统一多模态了解和生成字节 Se模型 BAed 开源

+关注

6 月 3 日音讯 ,字节字节跳动 Seed 团队上星期宣告开源一致多模态了解和生成模型 。开源 BAGEL。统多 ,模态模型该模型支撑文本、解和图画和视频的生成一致了解和生成。

图片

BAGEL 具有 70 亿个激活参数(一共 140 亿个) ,并在大规模交织多模态数据上进行练习 。开源BAGEL 在规范多模态了解排行榜上逾越了当前尖端的统多开源 VLMs 。 ,模态模型如 Qwen2.5-VL 和 InternVL-2.5,解和而且供给了与专业生成器如 SD3 竞赛的生成文本到图画质量 。

此外 ,字节BAGEL 在经典的开源图画修改场景中展现了比抢先的开源模型更好的定性成果 。更重要的统多是,它扩展到了自在方式的视觉操作 、多视图组成和国际导航 ,这些才能构成了超出以往图画修改模型规模的“国际建模”使命。

图片

详细来看 ,BAGEL 根据大言语模型进行练习 ,具有根底的推理和对话才能 ,可以处理图画和文本的混合输入,并以混合格局输出 。

混合输入-混合输出

▲ 混合输入-混合输出 。

BAGEL 可生成较高质量 、传神的图画、视频或图文交织的内容 。此外,还引入了长思想链 COT(Chain-of-Thought)方式,模型在生成之前可先“考虑” 。

BAGEL 通过“思考”生成了一个穿着毛衣的鳄鱼玩偶

▲ BAGEL 经过“考虑”生成了一个穿戴毛衣的鳄鱼玩偶 。

根据交织的多模态数据预练习 ,BAGEL 天然地学会了保存视觉特征和纤细细节,而且能从视频中捕捉杂乱的视觉运动 ,这些才能使得 BAGEL 在图画修改上更为高效。

图片

基于同一人物形象进行图像编辑

▲ 根据同一人物形象进行图画修改  。

根据对视觉内容和风格的了解 ,BAGEL 仅运用较少的对齐数据,即可完成图片的风格切换 ,乃至还可转化至不同场景中。

BAGEL 实现多种风格迁移

▲ BAGEL 完成多种风格搬迁。

此外,BAGEL 还具有国际模型的根底才能,可完成国际导航、未来帧猜测、3D 国际生成等更具挑战性的使命,并进行不同视点的旋转或视角切换。一起,BAGEL 还具有较强的泛化才能,不仅在各类实在场景中 ,还能在游戏 、艺术作品、卡通动画等场景中完成导航 。

根据以上才能  ,BAGEL 还可经过一个一致的多模态接口,完成各项才能的杂乱组合,进行多轮对话 。

图片剪切-智能编辑-场景转换-风格转换组合功能

▲ 图片剪切-智能修改-场景转化-风格转化组合功用 。

附 BAGEL 开源地址:

官网及体会进口 :

https://seed.bytedance.com/bagel 。

GitHub 代码 :

https://github.com/bytedance-seed/BAGEL 。

模型权重 :

https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT  。

研讨论文 :

https://arxiv.org/pdf/2505.14683。

广告声明  :文内含有的对外跳转链接(包括不限于超链接 、二维码 、口令等方式) ,用于传递更多信息 ,节约甄选时刻 ,成果仅供参考  ,一切文章均包括本声明  。

分享到

0个赞
钓友回复627条
B站反腐通报 :原游戏协作部总经理因违法被捕
356小时前举报回复

B站反腐通报 :原游戏协作部总经理因违法被捕

我国首款千比特超导量子核算测控体系交给 ,助力量子核算机研制
532小时前举报回复

我国首款千比特超导量子核算测控体系交给 ,助力量子核算机研制

“夸克教师”发布 ,能模仿人类教师个性化讲题、命题
6734小时前举报回复

“夸克教师”发布 ,能模仿人类教师个性化讲题、命题

十二大补贴强势来袭,京东 618“最终 28 小时”将于 6 月 17 日晚 8 点敞开
99小时前举报回复

十二大补贴强势来袭,京东 618“最终 28 小时”将于 6 月 17 日晚 8 点敞开

超低延时重构AI推理体会!白山云发布“大模型API”产品
8265小时前举报回复

超低延时重构AI推理体会!白山云发布“大模型API”产品

广汽集团露脸2025轩辕轿车蓝皮书论坛
981小时前举报回复

广汽集团露脸2025轩辕轿车蓝皮书论坛

随时查看新帖子
安装安卓版钓鱼人安装iOS版钓鱼人
精彩渔获
安稳币概念部分回暖 正元才智涨超10%安稳币概念部分回暖 正元才智涨超10%
2024年全球数字贸易规模7.22万亿美元
,跌落稳居全球第四2024年全球数字贸易规模7.22万亿美元 ,跌落稳居全球第四
饿了么宣告持续加码超 10 亿元,扶持优质餐饮商家饿了么宣告持续加码超 10 亿元,扶持优质餐饮商家
最高法发布网络消费民事典型事例:直播带货货不对板、App 主动勾选隐私方针等最高法发布网络消费民事典型事例:直播带货货不对板、App 主动勾选隐私方针等
音讯称微软自研 AI 芯片遇阻音讯称微软自研 AI 芯片遇阻
火山引擎携手荣耀,助力智能终端才智印象与工作场景全面晋级火山引擎携手荣耀,助力智能终端才智印象与工作场景全面晋级
5G IIoT怎么开释工业4.0悉数潜能5G IIoT怎么开释工业4.0悉数潜能
广汽集团露脸第十七届世界轿车动力系统技能年会广汽集团露脸第十七届世界轿车动力系统技能年会
三星折叠屏新机规划曝光,手机壳预热发布三星折叠屏新机规划曝光,手机壳预热发布
“夸克教师”发布,能模仿人类教师个性化讲题、命题“夸克教师”发布 ,能模仿人类教师个性化讲题、命题
天猫 618 美食卡券
、洗护服务	
、稳妥等生活服务类成交用户规划增加 4 倍天猫 618 美食卡券 、洗护服务  、稳妥等生活服务类成交用户规划增加 4 倍
国家邮政局:今年前 5 月快递业务量累计完结 787.7 亿件,同比增加 20.1%国家邮政局:今年前 5 月快递业务量累计完结 787.7 亿件,同比增加 20.1%
芯才智 新未来丨第七届浦东新区长三角集成电路技术比赛正式发动芯才智 新未来丨第七届浦东新区长三角集成电路技术比赛正式发动
2025MWC上海亮点前瞻:机器人、才智出行与AI,关乎你的未来生活方式2025MWC上海亮点前瞻:机器人、才智出行与AI,关乎你的未来生活方式
“夸克教师”发布,能模仿人类教师个性化讲题、命题“夸克教师”发布 ,能模仿人类教师个性化讲题 、命题
花呗创始 "证书提额" 新模式 1000 种工作证书可用于花呗提额花呗创始 "证书提额" 新模式 1000 种工作证书可用于花呗提额
AI旅行渠道Airial完结300万美元种子轮融资AI旅行渠道Airial完结300万美元种子轮融资
500 元消费券全国可用 速看京东 618 领券购 iPhone 攻略�!500 元消费券全国可用 速看京东 618 领券购 iPhone 攻略 !
我国首个半固定式火箭海上发射实验渠道 HOS我国首个半固定式火箭海上发射实验渠道 HOS
离别保鲜焦虑!三星 AI 神 冰箱让食材自带韶光保鲜罩离别保鲜焦虑 !三星 AI 神 冰箱让食材自带韶光保鲜罩
把戏美食、花式冰饮 三星 AI 神 冰箱 5 系以科技之力让暑假高兴加倍把戏美食、花式冰饮 三星 AI 神 冰箱 5 系以科技之力让暑假高兴加倍
“6・18”期间,哪些卖点撑起安卓手机的亮眼体现?“6・18”期间,哪些卖点撑起安卓手机的亮眼体现?
中微爱芯低功耗运放产品线介绍中微爱芯低功耗运放产品线介绍
5 人水军团伙刷单上千万次被警方捕获
,涉案金额达数百万元5 人水军团伙刷单上千万次被警方捕获 ,涉案金额达数百万元
翼菲科技港股IPO	:济南的“小伟人”企业,应收账款3年增加392%翼菲科技港股IPO :济南的“小伟人”企业,应收账款3年增加392%
阿里千问 3 全系适配苹果 MLX 框架阿里千问 3 全系适配苹果 MLX 框架
2025MWC上海来袭	!RT2025MWC上海来袭 !RT
淘宝直播【直播爆爆日】跌落品牌开放季淘宝直播【直播爆爆日】跌落品牌开放季
华为前职工联手创业�,带“毫米波雷达龙头”冲刺IPO,严峻依靠比亚迪华为前职工联手创业 ,带“毫米波雷达龙头”冲刺IPO,严峻依靠比亚迪
广汽集团露脸第十七届世界轿车动力系统技能年会广汽集团露脸第十七届世界轿车动力系统技能年会
签到反馈意见向上