今日AI-豆包大模型-2024年9月26日

发现全网最新的AI内容

民酱:Llama 3.2开源 | 字节跳动豆包视频生成模型发布

文章概要:

1. Meta发布了Llama 3.,包括纯文本小模型和支持图文数据输入的多模态大模型。
2. Llama 32使用优化的转换器架构,支持多种语言,官方宣布不准欧洲使用。
. 字节跳动旗下的火山引擎发布了两款视频生成weed
4.Dance V14是ByteDance Research团队开发的视频生成大模型,同时支持生视频和生视频。
5. Doubao视频生成-Seaweed支持两种视频生成方式,输出为70p分辨率、24fps、时长5,并可动态至20-0秒。
阅读原文

烧钱过亿,用户靠投流,大模型算过成本账吗?

文章概要:

1. 广告投放是当下大模型白热化竞争中的一个切面,大模型厂商希望获得足够多的用户,讲一个大模型原生应用的故事,但现实是高额的成本、千万级的用户,都不足以支撑故事继续。
2. 烧钱换增长,一个月广告投放过亿,B站成了AI时代商业化赢麻了的平台,大模型创业公司最激进的是月之暗面,旗下的AI智能助手Kimi因长对话能力出圈,是时下最火热的大模型产品之一。
3. 算不过来的成本账,投放带来的结果显而易见,获客只是第一步,更重要的是留存和转化,大模型厂商们希望更多的用户来训练“调教”产品,用户有限的使用次数显然无法让他们来实现这个目标,好处是,厂商成本也不太多。
4. 小模型成救命稻草?疯狂投广告的背后,是厂商们极大的用户焦虑,因为没有用户,意味着故事没办法继续讲下去,几乎所有的创业公司都面临的挑战是,一旦投资人热情不再,企业的生存都面临极大的风险。
阅读原文

字节憋大招,中国版Sora该有的样子!

文章概要:

1. 字节跳动发布了豆包模型家族的新成员,豆包·视频生成模型、豆包音乐模型、豆包·同声传译模型、豆包通用模型pro 和文生图模型、语音合成模型等垂类模型。
2. 全新发布的豆包视频生成模型有两款:PixelDance、weed,活动现场展示的视频生成效果令人惊叹。
3. 豆包视频生成模型基于 DiT 架构,高效的DiT融合计算单元,让视频在大动态运自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头。
4. 新款豆包生成模型正在即梦AI内测版小范围测试,未来将开放给所有用户
阅读原文

要想富,先修路!火山引擎在AI时代修了一条“高速路”

文章概要:

1. 火山引擎在AI时代修了一条“高速路”,新发布的豆包·视频生成模型,给所有写视频脚本写的秃头的打工人送来一阵春风
2. 火山引擎新发布的三大模型和两大更新,基本代表了火山引擎的思考
3. 火山引擎的同声传译已经能做到高质量实时翻译,还支持跨语言同音色翻译
4. 火山引擎的音乐可以轻松生成一首包含旋律、歌词和演唱的1分钟高品质音乐作品
5. 火山引擎的豆包大模型家族提到的三个“更”——更强模型,更低价格,更易落地,可不只是卷那么简单,它试图让AI早点摆脱炫技阶段,找到足够多的场景,落地生根,和企业一起成长
6. 火山引擎为客户提供的业内最高标准的初始TPM(每分钟Tokens)和RPM(每分钟请求数),每分钟处理Tokens的最高限额达到同梯队模型的数倍
7. 火山引擎旗下的HiAgent允许企业用自然语言来开发自己的模型应用,只要聊聊天,说清楚需求,就能搭建起一个智能体,都不需要写代码,甚至不需要教学,就可以即用
8. 火山引擎持续升级全周期安全可信方案,构建起大模型的安全“堡垒
9. 火山引擎AI全栈云可以提供超高性能网络,支持3.2Tbps RDMA网络,时延优化最高达75%,文件存储vePFS支持2TB/s吞吐并行存储和3000万IOPS,而且GPU的利用率提升到100%+,不仅可以保障计算资源稳定运行,还能让每一块算力芯片都物尽其用,绝不浪费一点,绝不多花一分钱
10. 火山引擎手握重重利器,走在了前面
阅读原文

AI应用元年,豆包大模型为消费电子、游戏行业注入智能化创新动能

文章概要:

1. 2024火山引擎AI创新巡展在深圳举办,豆包主力模型能力再升级,豆包·视频生成模型、包·音乐模型、豆包·同声传译模型发布
2. 截至9月,豆包大模型的日均tokens使用量已经超过13万亿,4个月的时间里tokens整体增长超过了1倍
3. 创维酷开全面引入豆包模型,更智能化产品及服务,为运营提效
4. 中手游技术中心总监彭立人分享了豆包大模型、VikingDB向量数据库在中手游《仙剑世界》游戏项目中所发挥的重要作用> 5.引擎与创维酷开、中手游的合作,令大模型能力在消费电子、游戏等行业落地应用,为用户及提供多样化的智能服务
阅读原文

企业动态 | 抖音集团、宝德集团、国能日新、瑞博生物、依米康

文章概要:

1. 豆包大模型发布视频生成模型,语义理解精准、画质高保真。
2. 宝德精彩亮相中国-东盟博览会。
3. 国业绩斐然,全国风电运行对标结果出炉。
4. 瑞博生物与PHEIRON就AI辅助的RNA药物开发达成战略合作。
5. 邀请函,洞察AIDC需求下技术创新,米康即将献智2024中国算力。
阅读原文

豆包电脑版,原地封神了!

文章概要:

1. 豆包电脑版推出,可智能整合工作流程提高效率,让普通电脑秒变“AI PC”。
2. 豆包电脑版整体布局和浏览器类似,提供多种工具,可进行网页内容总结、划词搜索等。br>3. 豆包电脑版AI伴读和AI总结功能,可帮助用户阅读外文文章、写作大纲等。
4. 豆电脑版还能帮助用户快速分析市场数据报告,优化浏览网页和处理长篇文章的。
5. 豆包电脑版在模态能力上投入大,具备语音、截图提问、生图和音乐生成等功能。
6. 豆包电脑版不仅是工具,像是智能助手,为学习、工作和带来便利。
阅读原文

字节发布豆包视频生成模型,可保持多镜头一致性

文章概要:

字节的巡展上正式发布豆包视频生成-PixelDance、豆包视频生成aweed两款邀测br> 2. 豆包视频模型语义理解能力、多个主体运动的复杂交互,以及多切换的内容一致性均达到业界先进水平br 豆模型基于T架构,T单元视频在与运镜中变焦环绕、跟随能力 4.设计扩散方法攻克多一致性
视频生成、剧本场景和们提供创作辅助br> 7豆包内测测试将逐步开放用户 8 此次中包大模型不仅新增视频生成发布了包模型传译模型,已全面覆盖语言、语音、、视频模态。
9. 豆包大模型使用量实现在极速截至今年9月,豆包语言模型的日均使用量超过13万亿,相比5月首次发布时多也达到每天5万。<0 业内多家大模型目前最高仅支持300K甚至1token数承载企业生产。豆包大模型支持00初始TPM,行业平均水平,客户需求灵活扩容。
阅读原文

一键生成大片!字节跳动AI模型震撼上线,Sora不再是主角

文章概要:

1 字节跳动推出全新的PixelDance V1.和Seaweed模型,为影视行业和普通用户带来强大技术支持和高效创作工具
2. PixelDance V1.大模型能精准理解复杂文本指令,生成具备强大情感表达和故事性的片段,通过多主体互动带来前所未有的视频创作体验。
3. PixelDance V1通过先进的扩散模型训练方法,成功解决了多镜头切换时的一致性难题,赋予了普通用户导演的能力。
4. PixelDance.4支持多种比例和,为创作者提供了未有的自由度,打破了视频创作的边界。
5. 字节推出的豆包模型家族集成了13款模型,构建了完整的AIG工具生态,为企业提供了创作工具和提升生产效率的关键利器。
6. PixelDance V1.4和Seaweed模型将改变内容创作的方式,可能颠覆我们对视频制作的传统认知,迈向未来的起点。
阅读原文

字节又出狠招!豆包推出视频生成模型,直接对标Sora??

文章概要:

1. 字节跳动推出视频模型豆包PixelDance和豆包Seaweed
2. 豆包PixelDance模型具备人物的复杂连续动作、多镜头组合视频和的运镜控制三个显著特点
3. AI可能会很多岗位,引发失业潮
4. 华清远见在AI教育领域有独家秘密武器人工智能高端人才班
5. 华清远见拥有独立研发中心,历时5年打造出集实验、编程、项目、测评、竞赛于元宇宙人工智能在线实验平台
6. 华清远还自主研发出华清远见AI大模型,优化教学体验
华清远见提供优质的就业服务:简历优化、面试、公司内推、企业招聘、资源共享就业跟踪全流程求职保驾护航
8. 华清远见教育科技集团成立于2004年,是一家集产学研用于一体的科技驱动型新一代信息技术领域教育品牌
阅读原文

倒数17天|千万级豆包大模型 Tokens 已备好!还不来还不来?

文章概要:

1. AI 智能体线上挑战赛已全面开启社区官方为每位选手准备了千万级的免费包大模型 Tokens,个人及企业开发者均可申领,总价值 5的大赛奖池等待获奖者。
2. 每个报名的选手可以获得一次黑神话游戏的抽奖福利。
3. 参赛者基于扣子专业豆包大模型结合当下热门游戏相关 Bot,可以专注游戏本身,也可以围绕游戏主题进行延伸,创作出面向更多的创意 bot。
阅读原文

10 秒钟收获影视级短片,花式运镜主体依然清晰,这个全新国产视频模型稳稳拿捏

文章概要:

1. 豆包视频生成模型带来了全新设计的扩散模型,针对高动态的复杂场景,展现出了影视级写实度和逼真细节。
2. 豆包视频生成模型具有语义理解、一致性重要突破,充分掌握镜头。
3. 豆包视频生成模型具有炫酷运镜,无论动作怎么变,主角都是稳稳的。
4. 豆包视频生成模型从“高大上”到“好落地”,技术力强大,价格,易落地。
5. 豆包大模型能够支撑起每天超万亿tokens用量,通过字节跳动内部50+业务实践、30+行业客户的应用,不断增加的调用量,覆盖越来越多场景。
阅读原文

10 秒钟收获影视级短片,花式运镜主体依然清晰,这个全新国产视频模型稳稳拿捏

文章概要:

1. 豆包视频生成模型带来了全新设计的扩散模型,针对高动态复杂场景,展现出了影视级写实度和逼真细节。
2. 豆包视频生成模型的语义理解能力强大,能够精准领悟prompt文字内容,呈现出预期中的画面。
3. 豆包视频生成模型具备专业级光影布局和色彩调节能力,支持多种风格和镜头语言。
4. 豆包视频生成模型能够处理“变”与“不变”的挑战,保证主体一致性,表现强大。
5. 豆包视频生成模型支持多种风格和比例选择,给用户无比自由的选择。
6. 豆包视频生成模型的技术已经打磨了很久,性能优秀,脱颖而出。
7. 豆包大模型家族通过火山引擎和火山方舟,面向企业提供服务,价格低,门槛低。
8. 火山引擎通过全栈大模型服务,把豆包大模型的实力,真正接入到实际的业务场景中。
9. 豆包大模型能够支撑起每天超万亿tokens用量,通过字节跳动内部50+业务实践、30+行业客户的应用,不断增加的调用量,覆盖越来越多场景。
10. 大模型的应用成本已经得到很好解决,大模型要从卷价格走向卷性能,卷更好的模型能力和服务。
阅读原文

实测字节全新豆包·视频生成模型:Sora 画的饼被实现了......

文章概要:

1. 过去3个月中国厂商在AI视频赛道竞争激烈,字节跳动的视频生成模型备受期待。
2. 火山引擎AI创新巡展深圳站发布了2个视频生成模型PixelDance和Seaweed模型,其运镜和转场效果领先。
3. 作者对豆包·视频生成模型进行了测试,包括空间理解测试、特效电影测试、对决sora等,结果显示豆包·视频生成模型在各项测试中表现优异。
4. 豆包·视频生成模型在动画教育等领域也有很大的应用潜力。
5. 字节跳动在AI视频技术领域的研究由来已久,其技术实力和创新能力不容小觑。
阅读原文

字节全新发布豆包AI视频模型 - 再见了Sora,你的时代过去了。

文章概要:

1. 字节全新发布包AI视频模型:豆包视频生成-Pixel模型和Seaweed模型
2 豆Dance模型的三个最重要的特点:人物的复杂连续动作,多镜头组合视频,极致的镜控制
3 人物的复杂连续动作:过往AI视频的人物动作表演很致命,而豆包PixelDance做到了,可以做连续动作的人物表演
4. 多镜头组合视频:一张图+Prompt,就能生成风格、场景、人物一致的镜头,这个能力,豆包PixelDance做出来了
5. 极致运镜控制:豆包PixelDance模型的运镜,是我见过最离谱,最牛逼的
6. Sora一个巨型期货,从2.16号到,迟迟不见任何踪影而后,6.6号,可灵默不作声,正式上线,代表了中国Sora的输出。而今天,924号,字节再把AI视频,推向一个全新的高度
7. 今天这个豆包Dance模型,就会优先对企业开启邀测,过几天上线火山方舟,啥时候上线即梦向C用户全员开放,可能还得等一段时间,毕竟太新,他们说还想再优化优化能力了以后,就直接上线即梦,给全员开放了
阅读原文

字节视频生成模型:不鸣则已,一出手就是王炸 |新视界

文章概要:

1. 今年各大模型公司纷纷卷起多模态,其中视频生成备受期待字节跳动推出豆包生成模型,为该赛道再添一把火。
2. 豆包视频生成模型-Seaweed已在即梦AI内测版上线,生成效果显著摆脱了AI味,在多拍动作与主体复杂交互,以及切一致性方面都体现出惊艳效果。
3. 豆包视频生成模型ixelDance在镜头语言上有了更高的应用,有潜力成为专业影视辅助工具进一步降低了创作者创意实现门槛。
4. 目前豆包模型已在火山引擎官网面向企业客户邀测。个人用户可通过即梦测试版体验豆包视频生成模型的能力,目前正处于小范围邀测阶段。
5. 全新设计的扩散模型训练方法,成功攻克了多镜头切换时难以保持的困扰,在镜头语言起承转合上更加的丝滑。可以实现变焦、环绕、缩放等多种镜头语言,灵活控制,去除生成视频的AI味。
阅读原文

Agent+Bot:基于豆包大模型的自主应用创建

文章概要:

1. 火山引擎开发者社区举办AI智能体线上挑战赛,以个人为单位,通过豆包大模型搭建属于自己的Bot,可结合当下热门游戏主题,也可围绕游戏主题进行延伸。
2. 比赛时间为9月12日—10月13日,作品提交截止时间为10月13日前23:59。
. 奖品设置丰富,包括奖金、证书、扣子专业版额外资源等,获奖者还有机会获得扣子官方网站首页推荐、火山引擎开发者社区传播曝光扶持、火山引擎万有商场企业开发需求引荐。
. 参赛选手可参与黑神话悟空豪华版/普通版抽奖。
5. 赛前准备包括参赛报名、扣子专业版、领取豆包模型Tokens。
6. 作品提交需在10月9日00:00—10月13日23:59间将参赛作品发布到扣子应用商店,并使其公开可见,同时准备Bot说明文档,于10月13日2:59前将BotID、Bot链接和Bot说明文档上传作品提交入口。
阅读原文

两款中国AI产品的“领跑”秘籍!

文章概要:

1. 文章以大模型进入大众视野近两年,众多AI原生产品纷纷登场为背景,介绍了国产AI产品豆包和星野。
2. 豆包是字节系推出的AI智能助手,提供拍照答疑、图片生成、翻译等各类帮助;星野则是由大模型“六小虎”之一的Minmax所打造的AI陪伴产品,用户将与AI建立伙伴关系,通过对话推动故事和关系发展。
3. 文章分析了豆包和星野在各自赛道中胜出的原因,包括定位的精确和打磨到极致的用户体验。
4. 文章认为,AI产品不只在涌现也在成长,向着Spuer App狂奔的路途中,豆包和星野各有野望。
阅读原文

调研解读|中国版Sora(字节豆包AI视频模型)全新发布,国产多模态AI迎来重大突破

文章概要:

1. 9月24日,字节发布两款AI视频模型PixelDance和Seaweed
2. 9月25日OpenAI 宣布 ChatGPT 新版高级语音模式将在本周内向所有Plus和Team用户全量推送
3. 近期,Runway宣布与狮门影业达成合作打造定制视频
4.包视频生成模型在复杂人物连续动作处理、多镜头组合及一致性等方面展示出更强
5. 狮门影业与Runway的合作有望推动好莱坞大厂对AI技术的接受及使用,同时进一步提高AI技术在影视行业中的商业化落地机会
. AI语音技术伴随AI推理能力提升的同时,有望提高C端用户使用粘性
7. 今年5月,豆包大模型产品家族正式发布,截至今年9月,豆包大模型Tokens调用量提升超过10倍日均Tokens使用量超过1.3万亿
8. 多模态方面,日均生成图片5000万张,日均处理语音85万小时,相当于7万天广播节目的总时长
9. 豆包大模型产品家族还迎来三个新成员:视频生成模型、音乐生成模型、同声传译模型
0. 国内大厂纷纷加入AI视频团战,豆包大模型使用量有望持续提升,多模态能力的加强也有望带来更强劲的训练、推理算力需求,在国内大模型积极向视频模型跃迁时期看好未来国产算力
11. 建议关注以下投资方向:受益于AI多模态技术迭代的IP、影视相关公司;专注AI技术及应用开发相关公司;具有商业化落地机会的AI教育相关公司;AI游戏相关公司;AI营销相关公司
阅读原文

全面AIGC时代,豆包模型家族准备好了

文章概要:

1. 豆包模型家族已经集齐了文本、语音、图片、音乐、视频的AIGC全家桶共计13款模型,不断增加各类模态,并进入规模化调用时代
2. 豆包·视频生成模型能够遵循更复杂的指令,让不同人物完成多个动作指令的互动,精确理解语义关系,解锁时序性多拍动作指令,而非单一主体的简单动作
3. 新款豆包·视频生成模型正在通过火山引擎邀测中,未来将逐步开放给所有用户
4. 豆包·同声传译模型采用了端到端模型,让翻译更加精准、质量更高、时延更低。同时会模拟说话人的真人发音,媲美真人同传效果
5. 豆包的音乐模型采用了全新的方案,实现了音乐生成的框架,从词、曲、唱三个方面来生成高质量的音乐
6. 火山引擎AI创新巡展已经完成了第五站,在每一站中,模型的能力都会进一步提升
7. 豆包模型家族成为了真正「六边形战士」
8. 火山引擎已经在重点行业:零售、汽车、智能终端成立了行业大模型联盟,通过与合作伙伴一起探索大模型的产业应用
阅读原文

字节全新发布豆包AI视频模型,Sora的时代过去了!

文章概要:

1. 字节在火山引擎发布会上两款AI视频模型:豆包视频生成-PixelDance模型和Seaweed模型
2. 豆包PixelDance模型的特点包括:人物的复杂连续动作、多镜头极致的运镜控制
3. 豆包PixelDance模型可以生成连续 4. 豆包PixelDance模型可以生成多镜头组合视频,如拿着镰刀的死神朝女人走近、特写女人的脸,她惊恐地尖叫等
5. 豆包PixelDance模型的运镜控制很牛逼,如鸟瞰缩放上移旋转、360度围绕主体环绕、前后景变焦、摇摄、目标跟随、升降镜头等
6. 豆包PixelDance模型会优先对企业开启邀测,过几天上线火山方舟,等模型能力优化稳定,就会直接上线即梦,向C端用户全员开放
阅读原文

字节摊牌了,一次性发布两款豆包AI视频模型。Sora的时代结束!

文章概要:

1. 字节在火山引擎发布会上一次性发布了两款豆包AI视频模型:PixelDance和Seaweed模型,效果超越既往所有AI视频,AI视频进入新时代
2. Pixel模型具有精准的语义理解、超强的运镜控制和一致性的多镜头组合等特点,可以多风格、多比例兼容。4. 作者认为国产AI视频大模型已经超越了Sora,字节是AI视频的天花板,AI视频的未来被豆包拓展到更广阔的。
阅读原文

华泰 | 传媒:豆包AI新模型的四大关注点

文章概要:

1 字节跳动发布两款视频AI大模型,性能显著提升,包括PixelDance V1.4和Seaweed,新模型的发布意味着国产视频生成模型能力再进一步,同时能够在多个内容相关领域实现商业化。
2. PixelDance V1.4基于DiT结构,主要特点在于“叙事连贯性”,支持复杂的多主体互动和时序性动作,能生成动态、炫酷运镜的视频,并且具备一致性多镜头生成能力,支持多种风格和比例,可生成10秒的故事短片。
3. Seaweed大模型基于Transformer架构,主要特点“高质量视频效果”,根据用户输入的高清图像分辨率进行适配和保真,Seaweed可生成5秒视频,并延长至20-30秒。
4. 豆包音乐模型、豆包同声传译模型也在巡展中同时发布,此外豆包通用模型和文生图模型、语音合成模型等垂类模型也迎来升级。
5. 字节视频新模型将应用到内容创作相关领域,包括电商营销、动画教育、文旅、微电影和短剧等,提升内容生产效率与质量。可大幅降低制作门槛的同时拥有较高质量。
阅读原文

昨夜今晨发生了什么? |YiMagazine

文章概要:

1. 离岸兑美元汇率在9月25日早盘收复7.0关口,为去年5月以来的首次,创16个月以来新高。分析指出,人民币近期快速上涨主要受前一日央行政策支持及美联储降息等因素影响。
2. 9月24日,字节跳动火山引擎发布豆包视频生成-PixelDance、豆包视频生成-Sea两款大模型,并面向企业市场开启邀测。此举也意味着,继快手“可灵”,国内另一大短视频巨头字节跳动也正式进军AI视频生成领域。
3. 9月24日,越南企业Tasco声明,吉利汽车与Tasco签署协议,将在越南太平省成立一家汽车装配厂合资企业,总投资额约为1.68亿美元,其中吉利汽车出资比例36%。br> 4. 据《经济时报》9月25日报道,富士康正考虑10亿美元在印度泰米尔纳德邦建设一家智能手机显示屏模块组装厂,主要用于为苹果生产iPhone。
5. 当地时间月,微软宣布将在未来三年内投资13亿美元在墨西哥建设和人工智能基础设施。
6. 9月25日,蔚来宣布与中国石化达成了充电服务合作根据协议,自当日起,消费者可在蔚来和乐道App、车机及加电App等渠道上,实现中国石化充电桩的查询、导航、启动、支付等。
7. 9月2TikTok宣布将于2024年11月28日关闭音乐流媒体服务TikTok Music。在此日期之后对TikTok Music的访问,包括登录、订阅和所有其他功能,将不再可用,用户的账户个人数据将在TikTok Music关闭后自动删除。
8. 美国司法部于当地时间9月24日向纽约联邦法院提起诉讼,VISA非法垄断借记卡市场和扼杀同行竞争,导致美国消费者和企业支付了大量费用。
阅读原文

华泰 | 传媒:豆包AI新模型的四大关注点

文章概要:

1. 字节跳动发布两款视频AI大模型PixelDance V1.与Seaweed,显著提升。
2. 介绍两款模型的与应用、创新与亮点、豆包大模型生态以及传媒行业的发展机遇。
3. PixelDance V1.4基于DiT结构,主要特点在于“叙事连贯性”,支持复杂的多主体互动和时序性动作,能生成高动态、炫酷运镜的视频,并且具备一致性多镜头生成能力,支持多种风格和比例,可生成10秒的故事短片。
4. Seaweed大模型Transformer架构,主要特点在于“高质量视频效果”,能根据用户输入的高清图像分辨率进行适配和保真,weed可生成5秒视频,并延长至20-30秒。
5. 豆包音乐模型豆包同声传译模型也在巡展中同时发布此外豆包通用模型 和文生图模型、语音合成模型等垂类模型也迎来升级。
6. 字节视频新模型将应用到内容创作领域,包括电商营销、教育、城市文旅、和短剧等提升内容生产效率与质量。
阅读原文

字节跳动,进军AI视频

文章概要:

1. 字节宣告进军AI视频生成,火山引擎发布了豆包生成-PixelDance、豆包视频生成-Seaweed两款大,面向企业市场开启邀测
2. 豆包模型新增视频生成模型,还发布了豆音乐模型和同声传译模型,已全面覆盖语言、语音、图像、视频等全模态
3. 国内AI视频生成激战头部互联网大厂发力
4. 今年2月,OpenAI发布大模型Sora开启AI视频新时代,此后半年时间内,国产AI视频大模型也密集诞生>5. 6月份,发布视频生成大模型“可灵”,对标Sora支持通过文生图生视频、视频续写功能,生成2、30fps的080p高分辨率视频>6. “可灵”上线一周后,专注于3D内容生成技术的AI初创LumaAI发布了Dream 1.5,每120秒能生成120帧画面,还能快速生成5秒钟的电影级别视觉效果
7. 进入9月以来,AI视频之战掀起高潮
. 9月19阿里云CTO周靖人宣布通义万相全面升级,并发布全新视频生成模型,可生成影视级高清视频,应用于影视创作、动画设计、广告设计等领域
9月2,美图公司公布旗下美图奇想大Vision生成能力全面,实现生成能力、生成效率以及模型性能进阶,视频生成时长与画质、流畅及可信度等显著
1 字节跳动AI视频生成,之战或将迎来变局
阅读原文

字节跳动推出两款视频生成大模型

文章概要:

1. 字节推出两款视频生成大模型:豆包视频生成-PixelDance和豆包视频-Sea
2. 豆包视频生成模型在设计之初就考虑了商业化,其应用包括电商营销、动画教育文旅和微剧本等
3. 目前,豆包视频生成模型正在即梦AI内测版进行范围测试,未来计划所有开放
4. 国内AI视频生成领域竞争激烈,各大互联网企业纷纷自己的生成
阅读原文

千模大战,价格或已到底,到了拼性能的关口!

文章概要:

1. 9月24日下午,字节跳动旗下云服务平台火山引擎发布基于自研豆包大模型的视频、音乐生成模型和同声传译模型,其中两款视频生成大模型同时面向企业市场开启邀请测试
2. 火山引擎总裁谭待表示,大模型降价刺激了企业调用各家模型的需求,激活了国内AI应用层的创新,行业降价后,成本不再是创新的阻碍,下一步要做的是提升模型质量和性能> 3. 新款豆包视频模型能根据文字指令生成多种风格的视频,其技术能力主要来自抖音官方剪辑工具剪映,该模型正在即梦AI内测版小范围测试,开放给所有用户
4 可灵AI已累计服务超过260万用户,5300万张图片、2700万个视频,快手近期还发布了可灵AI导演共创计划
5. 如今,AI研究者们已经不满足于让仅具有语言智能,还打算赋予AI空间智能,乃至将AI推向更多领域
6. 5月,字节跳动的豆包以价格屠夫的姿态杀入AI大模型行业,其他巨头跟随降价,如今,豆包视频生成模型的推出,让更多用户期待起来
阅读原文

千模大战,价格或已到底,到了拼性能的关口!

文章概要:

1. 9月24日下午,字节跳动旗下云服务平台火山引擎在深圳发布自研豆包大模型视频、音乐生成模型和同声传译模型。
2. 5月,豆包大模型公布时以低于行业99%的定价,掀起国内大模型降价潮。阿里的Qwen大模型、腾讯的混元大模型等纷纷跟进。br>3. 当下,用户意愿和意识尚未培养起来,大模型盈利遥遥无期,所以,推理成本就决定了该产品和公司能够在里多久。
4. 新款豆包视频模型能根据文字指令生成写实、超、漫画、动画等多种风格的视频,与市面上其他视频模型的视觉效果类似。
5. 目前,新款豆包视频生成模型正在即梦内测版小范围测试未来将逐步开放给所有用户。
6. 9月13日,被称为AI教母的华人科学家李飞飞宣布推出AI公司World Labs(世界实验室)。World Labs同时宣布,已获得2.3亿美元融资(约合人民币16.2亿元)。<>7. 9月1日,宁德时代董事长曾毓群,在接受挪威主权财富基金主席Nicolai Tangen访谈时,表示宁德时代正在使用人工智能技术找到下一代革命性材料。
8. 9月23日,AI CEO 奥尔特曼Sam Altman)罕见地发表了一篇长文博客,标题为《智能时代》( Age),引发了广泛关注。
阅读原文

豆包发布视频大模型,可生成影视级视频

文章概要:

1. 字节跳动旗下的火山引擎在深圳举办的AI创新巡展会上,发布了最新两款视频大模型PixelDance和Seaweed,进军文生视频领域
2. 豆包视频模型能够轻松实现自然的多拍动作以及多主体复杂交互,生成的视频更加精准逼真
3. 豆视频模型生成的视频可以精准地遵循复杂提示不同人物在视频多个动作指令的互动,且互动过程流畅自然,毫无生硬之感
. 豆包视频模型在细节处理方面也相当出色,人物样貌、服装细节甚至头饰在不同运镜下都能始终保持一致,这种高度的一致性使得生成的视频接近实拍效果
5. 无论是特写镜头下人物面部的表情,全景镜头中人物服装的纹理和配饰的光泽,都能在各种运镜中保持稳定和清晰
. 光影方面,经过在剪映、即梦AI等场景中的不断打磨和持续迭代,豆包视频生成模型在画面视觉效果方面具备了专业级的水准
7. 架构方面,豆包视频模型基于先进的DiT开发而成,这一架构为模型的高效运行和强大功能提供了的基础
8. 风格方面包括黑白、3D动画、2D动画、国画等风格视频,包含1:1、3:4、4:3、16:9、9:16、21:9六个比例,适配于各种终端,电影、手机竖屏等不同画幅
9. 火山引擎总裁谭待表示,截至到9月豆包大模型日均tokens使用量已经超过1.3,4个月的时间里tokens整体增长超过了10倍
10. 在多模态方面,包·文图模型日均生成图片,000万张,此外,豆包目前日均处理语音85万小时
阅读原文

字节全新发布豆包AI视频模型——再见了Sora,你的时代过去了。

文章概要:

1. 字节跳动旗下火山引擎在深圳举办的AI创新巡展圆满结束,重磅发布两款全新的AI视频模型:豆包视频生成-PixelDance模型(以下简称P模型)和Seaweed模型
2. P模型强大,可以用3个关键词来概括:复杂连续动作,多镜头组合视频 ,极致的运镜控制
3. P模型在其他方面也表现出色,如解锁多动作、多主体,动作灵活,运镜酷炫,审美高级,风格多变等
4. 新款豆包视频正在即梦AI内测版小范围测试,今天就会优先对企业开启邀测,过几天上线火山方舟。未来将逐步开放给用户
5. 字节跳动凭借其强大的技术实力和市场影响力,正式进军AI视频生成领域,无疑将为整个行业带来新的活力和创新
阅读原文

字节跳动豆包大模型家族重磅更新

文章概要:

1. 9月2日,字节发布两款视频生成模型:「PixelDance」和「Seaweed」,豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。
2. PixelDance V14是ByteDance Research团队开发的 DiT 结构的视频生成大模型,同时支持文生视频和图生视频,能够一次性生成长达10秒的视频片段。
3. Seaweed版本支持两种文生视频和图生视频方式。该技术基于Transformer结构,利用时空压缩的潜空间进行训练,模型原生支持多分辨率生成,适配横屏、竖屏,并能够根据用户输入的高清图像分辨率进行适配和保真。
4. 基于豆包视频生成模型,用户可以通过输入文字和获得一段视频。这一采用了高效的DiT融合计算单元、全新设计的扩散模型训练方法、深度优化的Transformer结构。其优势在于首先能实现对复杂指令的理解和遵循,解锁时序性多拍动作指令与多个主体间的交互能力。
5. 2024Q2传媒行业配置比例下降明显。Q2传媒行业在基金重仓占比的比重是0.6%左右,相比于24Q1小幅下降,仍处于历史低位。TMT板块中电子、通信赛道相对拥挤,Q4行情反弹率先看传媒板块的弹性与空间。
6. AI应用端元年或提前到来。今年AI视频生成领域竞争激烈,多家AI公司推出新的视频生成模型,从图像生成、图像编辑到更为复杂的长视频、三维信息生成等模型问世,提前抢占用户生态市场,加速应用端规模化与商业化落地。
7. 不少传媒公司市值管理态度积极,尤其在主营业务降本增效、外延式并购、产业转型升级央企改革等方面推动明显。建议关注相关标的。
8. AI大模型/数据/工具:海内外AI视频应用端竞争,打开算料商业化空间。
阅读原文

字节跳动,进军AI视频

文章概要:

1. 字节跳动进军AI视频领域,旗下火山引擎发布两款大模型。br>2. 国内AI视频生成激战正酣,互联网大厂纷纷发力。
3. 字节入局或使巨头之战迎来变局。
阅读原文

AI视频生成大战升级!字节跳动进军视频生成赛道,谁将引领视频创作新时代?

文章概要:

1. 字节跳动旗下的火山引擎在深圳举办AI创新巡展,发布两款全新的视频生成大模型——豆包·视频生成模型,具体为豆包视频生成-PixelDance和豆包视频生成-Seaweed,标志着字节跳动正式进军AI视频生成领域。
2. 豆包视频生成模型在技术创新方面有着显著的优势,基于DiT架构,通过高效的DiT融合计算单元实现了视频与文本的充分压缩编码,使得视频在大动态与运镜中能够自由切换,具备变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。
3. 目前新款豆包视频生成模型正在即梦AI内测版进行小范围测试,未来将逐步开放给所有用户。
4. 近年来,随着人工智能技术的迅猛发展,AI视频生成领域正迎来前所未有的发展机遇。国内互联网大厂纷纷布局,试图在这个新兴市场中占据一席之地。
5. 目前国内外AI视频产品在操作方式和功能设计上呈现出高度的相似性。用户通过文字指令,结合画幅、清晰度、风格及生成时长等选项,即可一键生成视频。然而,在这些看似简单操作的背后,却隐藏着巨大的技术差异。其中,视频的清晰度和生成时长成为了各家竞争的焦点。
6. AI视频技术的缓慢进化,背后有着深层次的原因。首先,视频训练数据的稀缺性成为制约技术发展的关键因素。其次,AI视频模型在风格上的局限性也不容忽视。尽管AI视频技术在不断进步,但其在商业化应用上的探索仍显稚嫩。
阅读原文