今日AI-大模型-2024年12月4日

发现全网最新的AI内容

AI大模型赋能自我报告聊天机器人:一种零样本提示工程新范式

文章概要:

1 本文解读了发表在CSCW 2024的一篇研究论文,提出了基于大模型的零样本提示工程方法,用于构建自然、智能的自我报告对话系统。
2. 该系统采用了包含提示前缀、对话历史和大语言模型的优雅架构设计,提出了信息格式和人设修饰符两个关键的提示设计因素,并针对四个不同的健康相关主题设计了对话场景。
3. 研究者招募了48名参与者进行在线实验,评估了槽位填充效果、对话行为分析、共情与互动行为。
4. 实验结果表明,该系统在数据收集方面具有有效性,能够自然地在不同对话行为间转换,展现出良好的共情能力和互动性。
5. 本文提出的方法无需任何训练数据或微调,通过组合结构化和描述性提示,以及引入人设修饰符,实现了对模型行为的精确控制,能够自然地维护对话状态,追踪已收集的信息,并在适当时机补充缺失信息。
6. 该研究成果对于推动对话在实际应用中的落地具有重要的参考价值。
阅读原文

AWS re:Invent 发布自研大模型全家桶Nova

文章概要:

1. 亚马逊CEO Andy Jassy介绍当前遇到的痛点以及发布自研模型的原因。
2. 重磅发布自研大模型Amazon Nova新的最先进的基础模型,提供前沿智能和行业领先的性价比。
3. 客户希望围绕生成AI做更多的事情,而不仅仅是文本输出。他们在图像、视频方面也有很多需求,有很多例子,但简单的例子是广告、营销或培训材料。
4. 亚马逊云科技在安全性、合规性上的保障从来不少,并且往往第一件事就是考虑安全。在大模型和Agent平台也是,提供了多种防护机制保障生成的内容不含有敏感信息、提供水印检测来识别图片是否由大模型生成。也有一些吞吐量和评估的功能。
阅读原文

2024中国大模型,一超多强格局依旧

文章概要:

1. 2023年初,文心一言的出现给各界带来了答案,此后,文心大模型始终走在中国大模型的前列,产业保持着“文心一超,大厂与大模型独角兽多强的产业。br> 2. 204末,媒体提出大模型拐点已至的看法,认为未来将属于模型起步较晚具备资本、宣发等优势后来者。然而,大模型的格局真的发生改变了吗?
3.1月30日互联网络信息中心第五届中国互联网基础资源上发布生成式人工智能应用发展报告(02》,根据报告显示,的文模型使用率第一,实现用户数量领先。
4.大模型格局不变的核心要素,文心能与其他大差距的核心原因在于:它选择了拥抱核心技术自研路线,取得。
5 文心大模型在C端始终保持着断层领先。
6 文心大差异化之一,就是将千行百业的智能化作为大模型目标核心。> 7. 在肉眼可见的中,保持核心技术领先并能够迭代的心,依旧将保持中国大模型超多格局。
阅读原文

腾讯悄悄搞了个大事,130亿参数的混元AI视频大模型,现在开源免费用

文章概要:

1. 腾讯推出了旗下首个AI视频大模型混元视频模型,并将其
2 混元视频模型参数10亿,支持中英文双语输入,模拟物理世界镜,识别精准,动作一致性,的视频可带音乐
3版下载为httpsgithub.comencent/HunVideo,内测版在元宝APP/版上内测链接为https://yuanbao.tencent.com/bot/app/share/chat/GKAJQFF/videoTrafficDiversion
4. 实测结论表明,混元视频在提示词理解和遵循、运动稳定性、物理世界规律性感镜头转换等表现出色
5. 混元视频模型目前只有生视频,对提示词有一定要求,为内容描述+(风格镜头++景+光线+焦点景深++)
6. 作者生成了几个测试视频,包括写实运动视频转场和多视频,展示了混元模型
7.已经开源了不少大模型包括生成、生成视频
8 文章首图标题为《花束般》创作者为葉子AI算法提供为Midjourney V6.
阅读原文

连发六款大模型!亚马逊云科技吹响万能模型“集结号”

文章概要:

1. 亚马逊云科技在re:Invent大会上发布六款大模型,包括Nova Micro、Nova Lite、Nova Pro、Nova Premier、Nova Canvas和Nova Reel,覆盖文字、图片、视频等主要内容生成领域。
2. 亚马逊云科技计划明年中期推出语音转语音模型和任意转任意万能模型,可输出文本、图片、、视频等任何模态的内容。
3. 亚马逊云科技推出由Trainium2芯片驱动的Amazon EC2 Trn2实例和集成了64颗Trainium2芯片的AI服务器Trn2 UltraServer,还发布了新一代AI训练芯片Trainium3,正在构建名为Project Rainier的Trn2 UltraServers EC2 UltraCluster。
4. 亚马逊云科技拥有领先的全栈AI技术,包括新一代AI网络结构tnp10、自动推理检查、多Agent协作、模型蒸馏等功能。
5. 亚马逊云科技升级了Amazon Q Developer辅助编程平台、与NVIDIA联手打造Blackwell架构P6实例、升级数据管理系统,并推出了全新数据中心组件。
亚马逊云科技志向远大,在通过更高性价比的算力方案助推大模型落地应用的同时,积极万能大模型这一终极形态。
阅读原文

AI 大模型带给 BI 的跃迁变化

文章概要:

1. AI模型的诞生引发了新的革命,对信息进行梳理,如今大模型带给 BI 行业的变化
2. 介绍了融合 AI 大模型的 BI 厂商,如 SmartBI 公司的「AIChat 白泽」、腾讯云「ChatBI」网易数帆的有数 ChatBI」等
3. 基于 LLM 大模型,形态以式交互为主接收用户语音输入或者自然输入
4.腾讯 ChatBI 的产品体验,介绍这类产品功能,支持多对话智能追问、联想、猜你想问、SQL 校验与数据分享
5. 同样是一站式数据分析平台,“可视化 BI ”的拽功能已经不具备产品优势。有了对话式交互 BI,部门无需拖拉拽技巧,节省时间
6. ChatBI 面对的挑战如何保证问答效果,从而保证数据。为了解决问题腾讯云 ChatBI 推出数据领域知识库,并支持手动添加某一数据表对话示例
. 除了大模型能力构建,产品上还可以利用”Prompt提示词功能,团队对话输入时尽量标准化采用格式:数据统计时间周期维度+
阅读原文

AI赋能教育时代:讯飞星火、通义千问、天工AI、豆包AI、GPT-4O、商汤AI、文心一言8个AI大模型应用(带链接)建议收藏

文章概要:

1 人工智能教育展现出巨大赋能潜力,心讯飞星火、义问、天 AI、 AI豆包、-O、汤 这 AI 大模型当下备受关注人工智能范例。br>. 文章详细剖析了 AI 大的功能特点与优势所在,并给出了它们的链接。
阅读原文

2024年十大开源大模型RAG框架!

文章概要:

1. 介绍了检索增强生成(RAG)技术的基本概念和作用。
2. 比较了LangChain和RAG的区别。
3. 列举了目前在GitHub上可用的10种顶级RAG框架,包括Haystack、RAGFlow、txtai、STORM、LLM-App、Cognita、R2R、Neurite、FlashRAG和Canopy,并分别介绍了它们的特点和优势。
阅读原文

大模型拯救数字人|甲子光年

文章概要:

1. 文章了AI加持下数字人是否是一门好生意,以及AI大模型与数字人的结合对的影响。
2. 文章指出,数字人爆火于2020年之前,当时的虚拟人分为平面2D数字人和D超写实虚拟人两种技术路线,但都存在成本高、商业化空间局促、实时互动瓶颈等问题。
3. 生成式AI的出现让数字人更加普及,成本降低,应用场景增多。
4. AI大模型与数字人的结合是一场双向奔赴,数字人是大模型给出的第一个答案,也是大模型商业化的最大公约数。
5. 文章认为,数字人将成为AI大模型的服务入口,为客户提供更好的服务。
阅读原文

AI大模型赋能抗体工程:使用深度测序和机器学习优化抗体设计

文章概要:

1. 随着生物医药领域的快速发展,如何设计和优化具有高特异性和亲和力的抗体变体已成为一个重要课题。近期发表在Computational and Structural Biotechnology Journal上的一项研究展示了如何运用深度测序技术和机器学习方法来优化抗体变体的设计,特别是针对基质金属蛋白酶-9(MMP-9)的结合能力。
2. 本研究采用了多个创新性的技术方法:酵母表面展示技术研究团队使用荧光激活细胞分选(FACS)对表达在酵母表面的scFv抗体文库进行筛选,以获得具有增强MMP-9结合能力的抗体变体。
3. 研究人员通过对筛选得到的阳性和阴性抗体群体进行下一代测序,发现:CDR-H3区域中极性氨基酸(如Ser、Tyr等)的富集;最适宜的CDR-H3长度为11个氨基酸;带电荷的氨基酸(如Arg)对结合能力有显著影响。
4. 研究团队开发了基于大型蛋白质语言模型的深度学习系统,该系统在交叉验证和独立测试集上均达到98%以上的准确率。
5. 抗体优化效果:筛选获得的scFv变体相比原始抗体,对MMP-9的结合能力提高了6倍;表达水平提升3倍;具有更好的选择性,对MMP-3的交叉反应性显著降低。
6. 结构特征分析:CDR-H3区域呈现出正电荷分布,与MMP-9活性位点的负电荷相互补;优化后的抗体具有更合适的构象,有利于与靶标结合。
7. 机器学习模型的预测能力:模型能准确预测CDR-H3序列的结合能力;通过SHAP分析揭示了影响结合的关键位点;为后续的理性设计提供了重要指导。
8. 深度学习架构创新:研究采用了双阶段的深度学习架构:第一阶段:使用预训练的蛋白质语言模型提取序列特征;第二阶段:构建LSTM网络进行序列到功能的映射。
9. 特征提取方法:使用ESM-2模型提取1280维的氨基酸嵌入向量;通过注意力机制捕捉序列中的长程依赖关系;结合位置编码增强序列信息的表示。
10. 模型训练策略:采用交叉熵损失函数;使用Adam优化器,学习率为0.001;实施早停策略避免过拟合。
11. 应用前景与展望:抗体药物开发:为抗体优化提供了高效的计算方法;可快速预测新设计序列的性能;降低了实验成本和周期;扩展:该方法可推广到其他靶点的抗体优化;框架可用于其他蛋白质工程问题;为生物药物开发提供新思路。
12. 后续研究方向:进一步优化模型架构;整合更多实验数据;开发端到端的抗体设计系统。
13. 本研究展示了将深度学习技术应用于抗体工程的成功案例,不仅获得了性能显著提升的抗体变体,还建立了可靠的计算预测模型。这种方法的成功将为抗体药物的开发带来新的机遇,推动生物医药领域的技术革新。
阅读原文

AI大模型助力免疫治疗:蛋白语言模型驱动CAR-T细胞疗法创新突破

文章概要:

1.当代医学领域,免疫治疗特别是CAR-T细胞疗法已经成为治疗癌症和自身免疫疾病的重要突破口。近日,Coding Bio团队在最新研究中提出了一种创新方法,利用蛋白质语言模型(PLM)来优化CAR-T细胞治疗的设计过程,为免疫治疗领域带来了新的曙光。
2. 研究团队提出了一个革命性的方案:将大规模蛋白质语言模型与高通量实验平台相结合,通过偏好优化来指导CAR的设计优化。具体来说,这个方案包含以下几个关键环节:
(1)高通量实验平台:论文中图2展示了候选CAR筛选的完整流程,包括从高度多样化的起始文库开始,通过噬菌体展示技术筛选结合特定靶标的序列,将筛选获得的序列重新为CAR文库,通过高通量细胞实验评估CAR的功能。
(2)偏好优化驱动的模型训练:研究团队采用了直接偏好优化(DPO)方法来训练模型,其核心数学表达式为:这个优化目标旨在最大化被选中序列与被拒绝序列之间的边际差异。
(3)模型架构与训练策略:研究团队选择了ProGen2作为基础模型,这是一个在约2.8亿个蛋白质序列上预训练的模型。论文中图4展示了不同损失函数训练过程中的模型行为对比,结果表明KTO损失函数在维持高边际的同时,能够更好地提升目标序列的似然度。
3. 研究团队通过三组实验来验证方法的有效性:
(1)贪婪生成实验:论文中图5和图6展示了模型与CAR活性之间的相关性。结果显示,经过优化的模型能够准确预测CAR的活性,两者呈现显著的负相关(相关系数达到-0.574)。
(2)穷举搜索实验:研究证实,虽然计算成本较高,但穷举搜索能发现更多高性能的CAR变体。
(3)少样本成熟化实验:论文中图7展示了10不同CAR序列的优化结果,其中多个优化后的变体展现出超过原始序列2倍以上的活性提升。
4. 本研究的主要创新点包括:
(1)首次将蛋白质语言模型应用于CAR-T细胞疗法的优化设计
(2)提出了基于偏好学习的模型训练方法,能够有效捕捉CAR性能特征
(3)建立了高通量实验与计算方法相结合的工作流程
5. 研究团队指出,未来的工作将聚焦于:
(1)利用单细胞测序数据获取更全面的基因表达谱信息
(2)整合蛋白质结构信息,引入图学习技术
(3)扩展到其他类型的免疫治疗药物开发
6. 研究展示了人工智能技术在生物医药领域的巨大潜力,为新一代免疫治疗药物的开发提供了有力工具。随着技术的不断完善,我们有理由期待更多突破性的治疗方案问世。
阅读原文

大模型企业TOP50:百度、阿里、百川位居前三

文章概要:

1. 11月27,在2024大大会上,中国评价与中关村数人工智能联盟发布了《02中国大模型5发展报告》及“2模型50榜单”
2 报告要点:企业分类为“通用”“行业垂直发展格局;市场是专业化与多样化;分布呈现东部,京沪领先;上市状况是多数未上市独角兽企业;状态是重视与知识产权保护智能体在通用型企业得到推广;规模竞争进入万亿级时代;开发者生态促进数据产业繁荣;社会责任方面,近企业通过组织公益活动方式展现责任感。br3 文章来源:242特大牛大模型企业TOP5百度、、位居前三。
阅读原文

华为在大模型推荐系统领域的创新与应用研究

文章概要:

1. 华为在大模型推荐领域了深入的探索和应用,分析如何利用大型语言模型(M推荐系统取得,这些如何重塑推荐流程和用户。br> 2 大模型时代的推荐系统引入了外部开放世界,了信号跨域推荐,适合启动。
3 LLM4Rec在推荐中的应用现在多个,特征工程、编码、打分/排序、交互控制。
5LM工程中的体利用LLM知识辅助推荐,AR框架通过推荐场景分解关键因素用户偏好和物品外部知识分别对LL提问,M生成相应的兴趣知识和物品知识
阅读原文

大模型在国产工业软件中的应用场景探索

文章概要:

1. 大模型成为从信息化走向数智化的重要驱动力,本文旨在探索大模型与国产工业软件的结合及其落地实现方式,探讨了工业大模型的概念及其在工业软件中的应用场景。
2. 国产工业软件起步较晚,在性能上相比国外主流产品仍有较大差距,主流市场仍由国外软件主导。随着算力的快速提升,以大模型为代表的人工智能技术,将带来工业领域新的变化,并重构整个行业的生态。
3. 工业大模型依托基础大模型的结构和知识,融合工业细分行业的数据和专家经验,形成垂直化、场景化、专业化的应用模型。工业大模型相对基础大模型具有参数量少、专业度高、落地性强等优势,可以为工业垂直领域的技术突破、产品创新、生产变革等提供低成本解决方案。
4. 工业领域各种细分场景众多,涉及研发设计、生产制造、售后运维等诸多环节,细碎且复杂。因此,可按照全生命周期维度,划分为前端的研发与设计,中端的生产与制造,后端的售后与运维。
5. 武汉开目信息技术股份有限公司正在研发的AI工艺自动生成系统,解决了基于规则的CAPP系统具有一些传统专家系统固有的弊病。
6. 大模型和知识库的结合,可实现真正意义上的智能化工艺设计,但在工艺规划内容的生成方面,仍面临工艺规划精度要求高、设计模型噪音特征多、工艺规划先验知识杂、工艺生成训练样本少等技术瓶颈。
7. 为了结合传统技术与大模型的各自优势,扬长避短,我们采用不同的技术进行组合,设计了一套由特征/文档预处理模块,工序序列生成模块和工序序列填充模块组成自动化工艺生成系统。
阅读原文

6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了

文章概要:

1. 亚马逊云科技在 re:Invent 大会上官宣了六款自研基础模型 Amazon Nova 系列,包括文本模型、多模态模型图像生成模型视频生成模型等,这些模型在性能、价格和易用性上表现出色,其中 Nova Micro、Nova Lite 和 Nova Pro 已正式可用,Nova Premier 预计 2025 年第一季度可用,亚马逊云科技还计划开发万能生成模型。
2. Amazon Bedrock 发布了新功能,包括模型蒸馏和降低幻觉的功能,模型蒸馏功能可以帮助用户快速蒸馏出高效的小尺寸模型,降低模型的成本和延迟,提高模型的性能和准确性,降低幻觉的功能可以帮助用户防止模型产生幻觉,提高模型的可靠性和安全性。
3. 亚马逊云科技的 Amazon Q 由 Amazon Q Developer、Amazon Q Business 和 Amazon Q Apps 三部分组成,其中 Amazon Q Developer 进行了新一轮增强,包括自动执行单元测试、提供文档与代码审查智能体等功能,旨在帮助开发人员在整个软件开发过程中加快构建速度,并帮助用户在短时间内解决运营问题。
阅读原文

首个央企全自研视频生成大模型发布

文章概要:

1 12日电信“24数字科技”期间首届“AI 开发者在广州会上,AI视频生成大、大模型用平台、具身、传等创新、产品及成果发布产业联盟。br> 本次发布的视频大模型地打造了“VAST( As Storyboard from Text)阶段技术”,描述精准勾勒出包含视频、目标位置及姿态等信息“故事”Storyboard,进而生成视频内容。br>3.大模型升级至TeleSearch 20-基于知识视图万物控实现动态知识挂载事件认知,并驱动复杂逻辑理解br>4. 李学院长以“当梦想进”为题分享发布星海AI中台、天翼开放、智能体平台等平台,开发者大幅降低开发门槛,低成本、高效率的创新开发生态。,了TeleAI大全模态全尺寸产化构建最新进展及智能可以像流动到地方传技术前瞻布局。
. 大会期间,AI宣布华为、、亚等的9合作伙伴发布中国电信开发者产业联盟,聚合各方力量推动人工智能发展技术能力与水平,并为全球开发者赋能。
阅读原文

大模型背景下的软件公司

文章概要:

1. 大模型正深刻改变着软件的应用场景和工作模式,各行各业带来了前所未有的创新机遇
2. 大的出现使得软件应用场景得到了极大的拓展,在金融、医疗、、等发挥着越来越的作用>.公司的工作发生了变化,软件开发不再仅仅依赖于人工编码,而是转向了智能化编程与代码生成
. 大模型还促使公司加强跨合作,推动数据科学家、领域和开发人员共同参与项目中>5 大平台下的决策系统,引入自然语言交互,不仅提升数据能力还了用户,使得数据分析结果更加、从而为决策提供高效、灵活的
6. 借助大模型平台的强大计算能力和智能,工业软件能够实现工作流程和智能化,从而极大地提高了效率操作精度>.内部知识库建立和应用大模型在工业软件中的重要应用,它为企业提供一个集中高效利用知识
阅读原文

AI大模型市场巨震,亚马逊云科技Amazon Nova横空出世!

文章概要:

1. 亚马逊云科技推出新一代基础模型Amazon,涵盖对话、图片生成视频生成等领域,多种任务处理上展现强大性能,行业领先的性价比> 2 Nova包括超快速文本生成模型Amazon Nova、多模态模型Amazon Lite、Amazon Nova Pro和Amazon Nova,用于高质量图像的Amazon Nova Canvas和用于生成高质量视频 Nova Reel> 3. Amazon Nova“更快更强、更经济”,与Amazon Bedrock无缝集成,自定义微调、蒸馏,通过Amazon Bedrock知识库紧密集成还可以针对智能体应用进行优化> 4. 亚马逊云科技在225年Amazon Nova语音语音模型(Speech-Speech),“任意到任意”模型(Any-to-Any)br> 5. 亚马逊云科技以客户为全面投身基础模型领域,Amazon Nova的发布有望重塑AI大模型市场格局,企业AI大应用带来选择
阅读原文

腾讯开源AI视频模型!超强质感,能生打戏,连续镜头【附使用方法】

文章概要:

1 腾讯上线混元视频生成大模型,免费。
. 该模型具有超强的动作表现力,动作流畅自然,不扭曲,有镜子场景下人物动作和高度一致<>3. 模型具有纪录片级真实感能精准呈现光影细节。
. 模型具有超强语义理解能力,能读懂场景需求,自动规划的镜头语言br>5 模型具有镜头组合能力,能生成连贯的画面组合,风格统一,转场自然。
目前有三种使用方式:直接访问腾讯官方页面、本地部署(适合开发者。
阅读原文

大模型产业创新发展大会在南京成功举办

文章概要:

1. 大模型产业创新发展成功举办中国人工智能联盟指导,南京经济技术开发区主办。
2.经开区蓝军主任提出了经开区人工智能产业的目标和路径,数据局党组成员、省大数据管理中心中东主任了数据要素市场发展人工智能升级的支持作用
. 中国信通院了多项相关成果《人工智能发展报告(22)》、首批大模型“样板间”案例可信”的结果可信AI”成果。<>. 南京经开区正式启动“南京大模型集聚区服务建设,发布了十大AI+场景”举行了30母揭牌及合作的仪式,了个重点科技项目入驻了工智能的,并公布“谷杯大应用创新大赛获奖情况。br>.同期举办多个分论坛,“多模态大模型论坛、智能体分“大模型分”“智能化分论坛
阅读原文

6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了

文章概要:

1. 亚马逊云科技在 re:Invent 上宣布了六款自研基础模型 Amazon Nova 系列,包括文本模型、多模态模型、图像生成模型和视频生成模型等,这些模型性能、速度和成本方面都表现出色,其中 Nova Micro、Nova Lite 和 Nova Pro 已经可用,Nova Premier 预计将在 2025 年第一季度可用,亚马逊云科技还计划开发一种“Any to Any”的万能生成模型,预计于 2025 年中期推出。
2. Amazon Bedrock 的更新包括 Model Distillation 功能和 Automated Reasoning checks 功能,Model Distillation 功能使用户能够快速蒸馏出高效的小尺寸模型,Automated Reasoning checks 功能则能利用自动化推理检查来应对模型幻觉,提升模型的精准度。
3. Amazon Q 由 Amazon Q Developer、Amazon Q Business、Amazon Q Apps 三部分组成,本次核心更新出现在 Amazon Q Developer 上,它可以帮助开发人员在整个软件开发过程中加快构建速度,并帮助用户在短时间内解决运营问题。
阅读原文

AI大模型的第一批果实被谁摘了?

文章概要:

1. 2023年初,GPT3.了全球对人工智能时代的恐慌,各大互联网公司纷纷下场比拼大模型。经过两年的发展,大模型走向垂直应用已成为共识。
2. Applovin是一家移动技术公司,其AI应用主要通过引擎算法Axon实现。Axon 2.0相比1.0时代,在自动化、素材生成、准确性和广告活动效果等方面都有了显著提升。
3. Pinterest同样受益于大模型技术实现业绩增长,其广告业务也受益于大模型技术的驱动。大模型技术渗透到了营销的每个环节中,推动了整个流程的自动化率和ROAS。
4. 并非所有加入大模型赛道的公司都是受益者,大模型基础设施不足以及C端体验改善尚未转化成商业收入,但成本端却是实实在在的投入。
阅读原文

跟着开源学技术-开源AI大模型项目-FaceChain-打造个人数字形象的深度学习模型工具

文章概要:

1. 文章介绍了AI大模型Face,是一款用于打造个人数字形象的工具。
2 用户只需提供一张照片,FaceChain就能生成独属于自己的个人形象数字。
4. 该模型由阿里达摩院,根据用户上传的生成个性化且风格的3D人br> 5 文章还介绍了Chain的原理,包括训练阶段和推断阶段。
阅读原文