今日AI-大模型-2024年11月14日

发现全网最新的AI内容

2024年人工智能中文大模型使用手册

文章概要:

1. 人工智能(AI)已渗透到生活各方面,中文大模型是AI领域技术,引领智能科技新浪潮。本手册由东华大学图书馆馆长策划,AI平台生成整理编写,旨在帮助用户应用先进技术
2. 中文大模型基于深度学习,具备文本生成语义理解和对话交互能力,训练海量中文文本数据,能捕捉中文语言和多样性,实际应用中准确性和灵活性高,在内容创作、智能问答、情感分析、机器翻译卓越性能
3.和是无为之法,能帮助很多人,毫无利害换取观念。欢迎搜索公众号"科创行业研究"关注也可扫二维码关注,点在看是持续前行动力。声明本公众号致力于推送欢迎投稿)文章推送时原作者取得联系。版权归属原作者所有!若版权问题,敬请原作者联系我
阅读原文

【易·金融】理性回归:金融行业落地大模型拐点将至

文章概要:

1. 百度心大模型日均调用量增长迅猛,半年内增长7.倍,已接近于半年前的预期数字。
2. 大模型在产业端的落地,是百度持续探索的方向br>3大模型应用的热门行业之一。<>4. 百度智能云在与金融机构的大模型产品合作上,已有不错的进展。
5. 百度智能云推出百舸AI异构计算平台 4.0,目前已具备了成熟的10万卡集群部署和管理能力。
6. 百度智能云与中国邮政储蓄银行的合作,实现了GPU、CPU算力的规划重组,有力保障了300多个大小模型、6000多次训练任务。
阅读原文

空间转录组AI大模型问世:首个整合细胞通讯的基础模型框架

文章概要:

1. 上海交通大学和中国科学院过程工程研究所的研究团队在预印本平台发表了题为"A framework for gene representation on spatialomics"的研究论文,首次提出了一个专门针对空间转录组数据的基因表示框架,通过创新性地将空间微环境中的配体基因信息整合到单细胞转录组的transformer编码器中。
2. 该框架的整体架构包含以下关键创新点:对于单细胞分辨率的空间转录组数据,将每个细胞视为,预设半径内的邻近细胞构成其微环境,输入样本包含中心细胞的基因符号和表达值,以及微环境细胞的配体基因符号和表达值,6层identical transformer块处理输入,输出中心细胞的基因嵌入表示;针对spot-based空间转录组数据,首先进行细胞类型解卷积,创新性地提出了基于细胞类型比例的偏置交叉注意力机制,实现了在spot分辨率数据上进行单细胞级别的学习。
3. 研究团队在两个人类组织的Visium数据集上进行了预训练,预训练采用掩码学习目标,随机掩码15%的中心细胞基因,用三层预测掩码基因的表达值,最小化预测值与真实值之间的均方误差。
4. 论文通过多个下游任务验证了该框架的性能,包括细胞聚类、基因网络推断、配体-受体相互作用预测细胞通讯干扰分析。
5. 所有代码和预训练权重均已开源,数据集也已公开。
阅读原文

AI大模型FRATTVAE登场,开启药物分子生成新纪元

文章概要:

1. 研究背景:在药物发现和材料工程领域,如何高效发现具有理想分子特性的化合物一直是一个重大挑战。
2. 模型创新:FRATTVAE的核心创新点在于其独特的分子表示和模型架构设计。
3. 实验与性能评估:FRATTVAE在多个基准数据集上进行了全面评估。
4. 实际应用价值:FRATTVAE在多个实际应用场景中展现出巨大潜力。
5. 开源资源:项目相关资源已开源,可通过以下链接获取。
6. 总结与展望:FRATTVAE通过创新的树结构表示和Transformer架构,在分子生成领域实现了重要突破。
阅读原文

AI大模型助力解锁原核生物转录调控的奥秘:AI驱动的启动子序列设计新突破

文章概要:

1. 北京理工大学等机构的研究人员开发了一个名为PromoGen2的语言模型,可以为各种原核生物设计启动子序列。
2. PromoGen2的开发过程包含数据收集与处理、模型架构设计、创新训练策略等关键创新。
3. 研究团队在多个物种中进行了实验验证,包括枯草、大肠杆菌、地衣芽孢杆菌和非模式生物
4. 研究团队开发的PromoGen2-proka模型,涵盖5,800个原核生物基因组,包括1,757个属,总计427,477个核心启动子序列。
5. 这项研究不仅开发出了一个强大的启动子设计工具,更重要的是为合成生物学领域提供了一个新的研究范式。
阅读原文

AI大语言模型首次实现从头设计活性酶,AI蛋白质制造的新时代已来

文章概要:

1. 研究背景:在生物技术、医药和化工行业中,定制化设计酶是一个重要而具有挑战性的目标。近日,来自德国拜罗伊特大学的研究团队在bioRxiv上发表了一篇重要论文,首次利用大语言模型(LLMs)成功从头设计出具有活性的三磷酸甘油醛异构酶(TIM)。
2. 研究方法:研究团队采用了两种不同的大语言模型方法来设计TIM酶:条件生成模型ZymCTRL、无条件生成模型ProtGPT2。
3. 关键结果:序列生成与筛选、实验、SpokenTIM9的深入表征。
4. 创新性与意义:首次证明大语言模型能够从头设计复杂的多步骤催化酶,设计的酶序列与天然序列差异很大(相似度<35%),但仍具有良好活性,展示了条件生成和无条件生成两种不同策略的可行性,建立了一套完整的计算设计和实验验证流程。
5. 未来展望:改进模型以提高设计成功率,扩展到更多类型的酶设计,结合其他AI技术进一步优化设计流程,探索设计全新功能的人工酶。
6. 技术细节:论文详细记录了实验条件和方法。
7. 总结:这项研究代表了蛋白质设计领域的重要突破,证明了大语言模型在复杂生物分子设计中的巨大潜力。
阅读原文

7个关键问题:大模型技术能彻底改变软件开发的未来吗?

文章概要:

1. 大模型技术为软件工程带来新机遇,如代码生成,但在解决深层次问题上能力有限,智能化支持成为,人员分化加剧,对软件维护类任务支持,滥用可能带来质量隐患
. 探索新的智能化路径,如人机协作演进式应用、DSL与大模型的应用生成、基于大模型的代码数字孪生算自主研发的SoFlu软件机器人融合了大模型改变了传统软件工程作业模式,了开发效率,降低了,了软件项目的高质量交付
阅读原文

从融资烧钱到商业落地,中国AI大模型的华丽转身

文章概要:

1. 大模型领域曾有过辉煌时刻,但如今繁荣表象下开始出现一些异常情况。
2. 据《纽约时报》报道,OpenAI 的营收虽然增长迅速,但亏损额也在不断增加。
3. 中国大模型市场也在逐渐降温,企业面临着艰难抉择。
4. 大模型盈利困局:烧钱易但盈利艰难。
5. 从甲方客户角度分析,他们对大模型持积极态度,但在将大模型与自身业务有效结合方面,还需深入探索。
6. 大模型发展:机遇与挑战交织的十字路口。
7. 对于实力雄厚、在云业务深耕多年的云,应对大模型发展挑战需全力以赴。而依赖融资发展的大模型创业公司面临更艰巨挑战。
8. 中国 AI 大模型企业:对未来走向的探索与思考。
阅读原文

百度的大模型棋局,都藏在这些李彦宏的非共识中

文章概要:

1. 李彦宏在AI领域提出了许多与众不同的观点,如不要造轮子,模型的意义在于应用;大模型对于ToB的改造,比互联网对于ToB的影响力要大一个数量级;下一个应用趋势将是智能体等。
2. 李彦宏是中国最早一批AI先行者,早在2012年就组建了国内最早的AI研究院,到了2019年前后,李彦宏的40次公开演讲、15万字,次次不离AI。
3. 李彦宏认为,技术的应用成本与创新的总和往往以跷跷板的结构出现。技术的成本越低,围绕技术所产生的创新就。br> 4. 李彦宏的答案是“超级有用”,围绕“超级有用”,刚刚结束百度世界2024大会上,百度发布了最新的检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
5. 李彦宏在大会现场展示的文心智能体平台上的TOP100智能体,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体,涵盖各行各业应用的方方面面。
阅读原文

从模型到应用,大模型产业落地进入加速期

文章概要:

1. 自生成式AI爆火以来,大模型如同一股旋风席卷全球,市场逐渐冷静,进入了更为理性的探索阶段,“产业落地”成为新的关键词。
2. 企业落地大模型的路径有三种:直接调用模型、模型应用效果优化、大模型应用开发。百度智能云千帆大模型平台从模型开发、模型服务、应用开发三大维度,为企业提供全流程服务,打通模型到应用“最后一公里”。
3. 百度智能云大模型应用秉持场景满足、技术普惠、安全可信的建设理念,打造了面向政府、企业内部通用场景和深入行业特色场景的领先、创新应用,目前已经在千行百业落地实践,助力激活产业发展的新动能。
4. 百度智能云发布大模型服务品牌“知一”,未来将通过知行合一的专业服务,助力企业AI落地。
5. 大模型正在深入企业核心场景、创造价值,好未来、高华证券、智联招聘、全景医学等企业正在借助大模型的能力,实现大规模的个性化教育、模拟人类专业投资者的思维方式、帮助企业更加快速、准确、高效得完成招聘流程、让医学影像更加精确等。
阅读原文

清华大学教授刘嘉:大模型是一个生命新物种|AI&Society百人百问

文章概要:

文章主要介绍了清华大学教授刘嘉关于大模型的观点,包括大模型的创造力、对就业的影响、对教育的启示、对社交的改变、对未来社会的展望等。
阅读原文

ChatGPT4o、o1 谁才是最佳大模型?

文章概要:

1. ChatGPT已成为众多用户的助手,广泛应用于写作、、学习和商业等多个领域。OpenAI提供了众多模型,如GPT-、GPT- Turbo、GPT-3.5、、O1 Mini等,用户常常会感到困惑,不知道如何选择最合适的模型本文将详细介绍模型特点,并分析如何根据自身需求选择
2. OpenAI的GPT系列目前有多个版本,如GPT-3.5、GPT-、GPT-4 Turbo、Mini、O1 Mini等,每个模型在速度、性能、价格等方面各具特色
3. 在了解了各个模型的特点后,可任务复杂度、速度预算控制等方面来选择合适的ChatGPT模型
4 OpenAI不断更新和优化其,以提升用户体验。最近几次重要的更新内容包括GPT-4 Turbo的、系统消息与任务定制GPTs功能
5.s是OpenAI新推出的功能,允许用户自定义ChatGPT的任务和行为。与通用模型不同,GPTs能根据需求进行个性化设置,提供专门的解决方案
阅读原文

百度为大模型落地铺出一条路

文章概要:

1. 百度为大模型落地铺出一条路,需求侧暖风劲吹,百度在推进文心大模型升级进化的同时,鼓呼大模型产业化落地的重要性,并探索AI应用的实现路径
2. 百度世界大会今年的主题设定为“应用来了”,李彦宏重点推介的全新AI应用iRAG、秒哒等,让人们感受到百度在该领域全球领先的技术实力及未来大模型对变革重构的巨大潜能 5. 百度对技术包括AI的坚定信仰和长期重磅投入,让百度最终成为了当前的自己而不是活别人,这为百度当前大模型能力全球领先及其平台之上AI应用的爆发在即准备了条件
6. 用户对大模型及其应用产品的接受度日增,大模型产业化落地的利好因素亦在持续增多,起于大模型能力的AI应用,爆发期将至
阅读原文

爱芯分享 | 基于AX650N/AX630C部署多模态大模型InternVL2-1B

文章概要:

1. InternVL2是由上海人工智能实验室OpenGVLab发布的一款多模态大模型,中文名称为“书生·万象”。
2. 该模型在多学科问答(MMMU)等任务上表现出色,并且具备处理多种模态数据的能力。
3. 本文将通过走马观花的方式,基于InternVL2家族中最小的InternVL2-1B模型来介绍其技术特点。
4. 同时也将分享基于爱芯元智的AX650N、AX630C两款端侧AI芯片适配InternVL2-1B的基本操作方法,向业界对端侧多模态大模型部署的开发者提供一种新的思路,促进社区对端侧多模态大模型的探索。
阅读原文

专业领域AI首选--华知大模型5.0智能应用全新上线,欢迎体验!

文章概要:

1. 华知模型5.0智能应用上线,以“服务专业,解决专业问题”为己任,在专业语料、模型参数、技术指标、效果、应用场景等方面实现了全面升级。
2. 华.0系列智能应用为技术研发、科研创新、教学育人以及决策管理等场景带来了AI时代新质生产力工具,实现了从AI知识库构建、知识搜索、知识问答到成果文档创新创新成果评价的全流程业务贯通。br>3. 华大模型5.0引入思维链+知识图谱,提高大模型解决复杂问题能力和可信度。
4. 华知大模型5.0实现图片中多模态内容理解,包括图像处理、版面分析、文本信息处理、表格识别等内容。
5 华知大模型5.0基于大模型的图片推送基于智能分析用户提问与写作需求,推送相关图片。
6. 华知大模型5.0实现知识管理流程的全面智能化,知识检索、深度研读、问答以及创作的创造性产出。
7. 华知大模型50实现用户本地数据和大模型的智能化自动融合,用户只需要批量上传或者导入各类文档,智能知识库工具实现低成本高效率文档语义标引
8. 华知大模型5.0提供AI赋能的智能化科技查助手,依托华知大模型海量的科研成果库,助力科研工作者高效、精准把握科技前沿动态,引领科技创新方向。
阅读原文

【每日精读】中国大模型要用Infra“降本增效”

文章概要:

1. 文章提到中国大模型需要用Infra“降本”
2. 文章来源为钛媒体> 3 该公众号为汇众智创不凡
阅读原文

中国大模型要用Infra“降本增效”|钛媒体AGI

文章概要:

1. AI Infra行业竞争激烈,成为中国AI大模型产业不可缺少的关键一环
2. AI Infra的作用是解决AI应用开发的上手门槛和大规模部署时的使用成本,实现模型发展的“提速降本”
3. 中国AI算力受限,需要通过AI系统化、计算体系结构化解决当前问题
4. 英伟达是全球能够完整提供AI算力服务、且做到最好的公司,国内AI Infra技术和商业化规模远低于英伟达
5. 无问芯穹是国内少数选择异构混训这条路径的创企,主要通过异构多种GPU卡来同时混训一个大模型
阅读原文

天虹百灵鸟AI大模型:从数字化到智能化的跨越

文章概要:

1. 天虹百灵鸟AI大模型以华为昇腾算力底座为核心,依托天虹全渠道、多业态的深度实践环境,利用超过百万级的天虹脱敏数据与精选行业公开数据集,融合前沿AI大模型技术,构建起精准高效的零售业务AI生态服务。
2. 百灵鸟AI大模型是从天虹的数字化实践中生长出来的一种能力体系,对业务、产业和对行业有足够深度的理解,而不是单纯的技术流的构建。4. 天虹股份副总经理、首席数字官郑蔓表示,百灵鸟AI大模型的推出对天虹的数字化转型意义,显著加速了天虹的智能化应用,提升了零售产业数字化和数字产业化的动力。
阅读原文

【Visual Intelligence】四川大学、南开大学、阿联酋MBZUAI等6所大学团队最新成果:视觉语言大模型性能评估

文章概要:

1 文章介绍了四川大学、南开大学、阿联酋MBZUAI等6所大学的最新成果,即对视觉大模型性能的评估
2. 文章选取了自然医疗和工业三个应用场景六项挑战性任务,三个最新的开源视觉语言大模型的和定位能力进行了评估
文章结合GPT4V,对模型在物体计数、荒谬问题回答、功能推理、属性识别和空间关系推理等通用任务中的多模态理解能力进行了实证性调查
4 文章构建了一个综合性的评估平台,涵盖了专用任务和五项任务,旨在全面评估语言大模型性能表现和应用潜力。<>5. 文章对三个主流视觉语言大模型专用能力和四个模型的通用能力进行评测,以深入探究其在不同任务场景下的适应性和效能。
6. 文章通过分析和调查,揭示了视觉语言大专用任务和通用任务性能优势与局限。
7. 文章进一步讨论了视觉语言大模型应用和,以及如何通过技术创新和模型优化来克服挑战,推动其广泛领域的应用。
阅读原文

突破15亿次调用 百度大模型加速释放AI商业价值

文章概要:

1. 全球大模型浪潮带动了创业投资热潮,但真正具备“超级应用”价值的大模型仍未出现
2 百度创始人李彦宏在百度世界大会上分享了自己对大模型的看法
3. 百度文心大模型日均调用量已突破15亿次反映出中国模型技术应用的快速成熟
4. 大模型技术以空前的速度进行迭代创新,但应用依然面临一些核心挑战
5. 百度使用了检索增强生成(R)技术,有效消除了文本生成中的
6. 百度推出了iRAG(Image-based RAG)技术,解决了图像生成幻觉> 7. 李彦了百度最新推出的无代码开发——秒哒
8 李彦宏展示了文心智能体平台TOP100智能体和TOP100产业应用
阅读原文

准确率达99%!沃行智能OCR识别 × 亚马逊AI大模型首次公开亮相

文章概要:

1. 国际货运代理需要处理大量文件,OCR技术识别表单耗时耗力准确率低,新表单学习成本高昂
2. WallTech基于亚马逊云推出全新OCR智能表单识别应用,实现大规模表单识别准确率达到99%,用户整体使用效率提升30%,客户满意度明显增强
3. 2024年10月31日-11月1日,亚马逊云科技联合金山办公打造“向AI共奔赴”走进·金山办公,亚马逊云科技生成式联合创新会上,WallTech基于Claude3.5的多模态OCR在国际物流行业的落地应用解决方案,首次公开展示
4. Claude3.5模型+CR表单识别,是世界前沿的AI大模型技术在国际物流场景下的一次成功落地应用,颠覆了旧有的传统OCR技术,效率革命> 5. WallTech作为国际物流SaaS领域先行者,将不断挖掘更多优秀AI产品,与旗下国际物流云服务软件融合共创,以生成式构建新质生产力,赋能物流业务中的每一个环节的落地应用和智能升级,提质增效推动传统国际物流行业迈向生成式AI发展新时代
阅读原文

大模型一体机加速大模型落地应用

文章概要:

1. 大模型一体机加速大落地应用,帮助企业快速、高效、稳定地大模型能力
2. 大模型市场正处于快速发展阶段,产品百花齐放,从通用向场景化发展
3. 大模型一体机降低大模型落地门槛,将专用AI加速、SSD存储、高速互联网络、定制化调度软件、预训练大模型及全栈工具深度整合在一起,可以加速应用上线,实现特定行业专属大模型快速部署
4. 大模型一体机的主要及优势:具备深度优化的高性能硬件、集成开发所需的全栈工具链、内置多种基座大模型
5. 中国信通院依托中国产业联盟人工智能关键和应用评测工信部重点实验室,三十多家企业研制了《大模型要求测试方法》,并开展了大模型的首轮评估
6. 目前大模型评估工作正在火热报名中,评估报名截止2024年125日,欢迎感兴趣的企业报名
阅读原文

中国信通院“安全大模型能力”第二批专项评测正式启动

文章概要:

1 随着生成式人工智能新技术的发展,通用大模型成为核心引擎,但国内安全大市场功能、性能和安全性参差不齐的问题。
中国信通院人工智能研究所依托中国人工智能产业发展联盟,携手行业内多家权威单位,共同研制并发布了两项规范。<> 2024年8中国信通院开展了首轮“安全大模型基础网络安全”评测工作,七家业内领先企业的安全模型产品顺利通过评估。 阅读原文

赛意信息“基于善谋GPT的PCB行业大模型及应用”入选2024年人工智能先锋案例集

文章概要:

1 中国人工智能产业发展联盟《204人工智能案例集》正式发布,共收到345个案例49个优秀案例入选,涉及24个行业领域>2.意信息“基于善谋的行业大模型应用”案例成功入选204AIIA先锋案例集,该案例由赛意信息易美科共同打造
3. 该案例入选AIIA,彰显了业界对赛意信息及解决方案的认可,了行业大模型的创新性与应用价值
4. 基于善谋的PCB行业大模型融合计算机视觉深度学习与自然语言处理技术,可提供工程MI参数提取、报价、质检、知识检索和问答等服务
5. “基于善谋GPTPCB大及应用已经能够准确识别和提取图纸中的关键工程参数将原本需要4~6小时的参数提取工作缩短至几分钟,确保了95%的准确率
. 基于善谋的PCB行业大模型通过三项自研算法提升PCB领域复杂图纸阅读、解析、提取、能力和智能应用水平
7. 赛意信息将持续基于行业需求的具体场景AI产品,更多生态内企业及,共同打造不同领域和场景的解决方案,丰富AI生态布局
阅读原文

钱教授课堂第2045课——大模型

文章概要:

1. 人工智能变革工作方式和思维方式,确立AI思维方式,其三大要素为数据、大模型和AI能力>2. 大模型训练遵循“面壁”,正向着轻量化发展
3. 巴黎奥运会将城市景点改造成赛场,方便人们流转观看比赛,这一创举成为了巴黎最好的城市宣传
阅读原文

智源行业应用大模型挑战赛开启报名!挖掘数据潜能,共创行业新篇

文章概要:

1. 11月1日,“智源行业应用大模型挑战赛”正式启动报名,推广行业数据集应用,为大模型技术在垂类行业的发展注入新活力。
2. 大赛背景是突破大模型行业落地的数据瓶颈,当前大模型技术在各行业落地应用时面临着数据集的难题,智源研究院发布了全球最大的行业预训练数据集IndustryCorpus1..0,得到了用户的高度认可和的大力支持。br>3. 大赛亮点是聚焦金融、医学、旅游三大行业,为参赛选手提供数据、免费和专家辅导资源,大家充分和创新能力。
. 本次挑战赛面向范围内的企业和个人开发者报名,分为企业组和个人组两个组别,设计了严格的评审机制和丰厚的。
阅读原文

​清华刘嘉教授:大模型是一个生命新物种|AI&Society百人百问

文章概要:

1. 大模型无疑已经具备了创造力,其attention机制可以在万事万物之间找到关系,从而产生新的内容。
2. 大模型会首先替代现在大家所认为的好工作,如律师、医生、教师等知识密集型行业。
3. 大模型时代需要全新的教育模式,清华正在全面把之前的大类招生变成书院式教育。
4. 大模型情感陪伴是人的刚需,它可以给人带来情绪价值,未来可能会出现情感机器人或情感大模型。br>5. 大模型不会导致能源危机,随着技术的进步,耗能会出现急剧下降。
6. AI可能会出现自我意识的觉醒,需要建立一套AI伦理学,站在更广的视角,去看未来的混合社会。
7. 硅基生命会接过碳基生命的火把,人类完成了使命,可以退出历史舞台,由下一个更好的生命来探索世界。
阅读原文

PCA Share | 大模型技术落地实践分享,硬核干货!

文章概要:

1. PCA Share系列活动将举行第三期:大模型智能体技术落地实践分享> 2. 讲座背景:大模型技术被为实现通用AGI的途径,而智能体技术是实现大模型落地的关键手段
3 演讲内容简介本次将围绕大模型体技术在中国移动的落地实践经验,做知识分享,希望与大家学习
. 主讲嘉宾:朱,博士,中国移动信息技术中心大模型智能体技术算法专家
5. 基本信息:时间为2024年111日(周六0~2:3讲座形式为线上,参会链接为https://meeting.tencent.com/dm/2U67VkXc
阅读原文

货拉拉利用大模型打造多场景个人、办公助理实践

文章概要:

1. 货拉拉利用大模型打造多场景个人、办公助理,包括AI助理与模型、多场景助理落地方案、AI驱动业务展望和问答环节。
2.助理深刻理解专业高效、且可以实现24小时不间断,帮助用户解决各种业务问题。
3. 货拉拉的AI助理应用探索主要有简单直接、真实细致、应用广泛三个特点。
4. 货拉拉自研了大模型应用平台——悟空平台,该平台的核心优势在于可以灵活应用大模型,支持直接或间接调用大模型进行开发。
5. 货拉拉在AI驱动下实现业务赋能,涉及的业务需求也越来越多样,业务诉求也逐渐进阶,具体可分为专业助手、AI问答助手、周报生成助手、多模态的AI助手、Muti-agent助手五个阶段。
6. 货拉拉在多模态AI助手方面的探索包括车险报价方案生成助手和培训对练助手。
7. 货拉拉探索了多场景融合的合作型multi-agent助手,在IT助手场景中,针对各业务场景搭建独立agent聚焦各自场景问题问答。
8. 整个AI行业一直在快速发展,未来五年、十年物流行业与AI结合后的发展前景令人遐想。
阅读原文

大模型赋能,打造智能融合通信新体验

文章概要:

1. 大模型时代推动融合通信发展,中关村科金作为领先的大模型技术与应用公司,积极拥抱大模型技术,并结合融合通信相关技术,为用户提供了更加优质、智能的通信体验。
2. ZRTC音视频中台是中关村科金在音视频通信技术方面的集大成之作融合多种互联网互动能力,叠加AI赋能业务,拓展出更多业务使用场景,最终构建了适用于不同场景、连接人、设备、场景的融合通信能力。
3 ICC呼叫中心体现了中关村科金如何助力电话网通信的智能转型,它逐步将产品从语音覆盖到多渠道、全媒体,再AI增强渠道能力在技术创新与用户体验上实现了质的飞跃。
4. 中关村科金基于自身在融合通信方面的综合实力和前瞻视野,正积极探索VoLTE技术在金融服务中的应用,特别是在可视化IVR领域的实践。
阅读原文

我国AI应用潮爆发 百度文心大模型日均调用量增长近30倍

文章概要:

1 百度创始人李彦宏在百度世界224大会上发表演讲,发布两大赋能应用的AI:检索增强的文生图技术(iR无代码工具“秒”。
2. 截至11月初,文心大模型的调用量15亿,5月披露的2亿,增长7.5,一年前披露的5000万次,更是增长0倍。
3. 李彦宏,智能体是AI应用的最主流形态,即将迎来点他依次讲解了公司、角色、工具和行业四大类智能体。
4. 针对大模型在图片生成上的问题,开发了增强的文生图技术RAG(image based RAG),百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。
5. 无代码工具“秒哒,具备无代码编程、多智能体协作和多工具调用三大特性,自然语言搭建一整套系统,将开启一个“只靠想法就能赚钱的时代”。
阅读原文

生成式 AI 能做好新闻报道吗?来看12 款大模型系统性评测

文章概要:

1. 2024年11月14日,2024智媒体50人成都会议暨每经20周年财经媒体峰会在蓉举行,《每日经济新闻大模型年度评测报告》正式发布。
2. 《每日经济新闻大模型年度评测报告》以大模型在新闻采编场景的应用能力为评测目标,以“采写编审和短视频创作的新闻生产全流程”为场景,包括大模型设计采访提纲、新闻稿件、稿件差错、提炼稿件标题、改写短视频文本五个细分场景。
3. 评测结果显示,腾讯混元hunyuan-turbo以379.53的总分位居榜首,紧随其后的是智谱GLM-4-Plus获得368.6分,字节跳动doubao-pro-32k(240828版本)获得363分。
4. 截至目前,每日经济新闻一共推出三期大模型评测报告,覆盖12项新闻采编应用场景,但从结果来看,没有一款大模型能在所有场景中均排名前列。
5. 各款大模型的长处与短板各不相同,在新闻生产的关键环节,多数大模型生成结果的差错频出,要保证新闻稿件的高质量、无差错,还必须由人工审核、把关。
6. 目前市面上还没有一款大模型能够高质量、全流程完成新闻采编场景的所有,换句话说,世界上还没有“AI记者”。
7. 大模型“幻觉”未解,错误更隐蔽,目前,AI生成内容已经大规模出现在互联网中。这就要求新闻媒体要进一步完善新闻内容真实性审核机制,更需要加强内容把关。
8. 大模型在阅读文章方面,难以具备对一篇稿件新闻点的准确和深层次把握,容易停留在浅层次的理解。因此,新闻点和新闻价值的判断,包括采写有温度、有故事、有人情味的厚重稿件,仍然离不开记者、编辑的人工介入和悉心打磨。
9. 绝大部分大模型在设计采访提纲、改写短视频文案、英汉翻译、文章阅读以及微博新闻写作等辅助性场景中普遍表现良好。而在撰写新闻稿件、校对稿件差错、提炼新闻标题等新闻生产关键性场景的能力则明显不足。
10. 记者、编辑可以根据采编工作的不同环节,场景,选择最适合的大模型,让部分场景实现采编工作AI化,提升工作效率。
11. 国内大模型通过持续迭代,能力稳步提升。同时,各家大模型之间的差距也在逐步缩小,每个模型都出独特的优势。但这些大模型都属于通用大模型,并非为新闻媒体、采编工作量身定制。
12. 新闻媒体在长期的新闻报道中已经积累的大量高质量新闻稿件和数据,这恰恰为研发适合新闻采编工作的大模型工具提供了的优势。
13. 在研发方法上,可以将采编全流程拆分成数十个环节,如采访、翻译、稿件写作、提炼摘要和校对差错等。根据各环节的具体工作目标、方法和要求,对大模型进行专项训练,以形成一系列单任务或垂类AI工具。最终,将这些单AI工具打包汇集,则可以打造出一整套新闻采编AI工具。
阅读原文

中国信通院“安全大模型能力”第二批专项评测正式启动

文章概要:

1. 中国信通院“安全大模型能力”第二批专项评测正式启动。
2. 通用大模型技术成为创新与变革的核心引擎,但国内安全大的安全基线和的场景及能力评价<> 3. 中国信通院人工智能研究所依托中国人工智能产业发展联盟行业内多家单位,发布两项规范,为网络安全大模型的功能、性能及安全性提供了科学的评估标准和。
4 2024年8月,中国《安全大要求与评估办法 》系列规范,开展了首轮“安全大模型网络安全能力”评测工作。br> 5. 204年度第二批“安全大模型基础网络安全能力”评测工作已正式启动多家企业积极响应并报名参与,评估报名已倒计时阶段。
阅读原文

中国联通范济安:大模型必须要与人交互才能发挥出作用

文章概要:

1. 11月14日中国联通集团大数据首席科学家范济安出席2024中国(黄石)工业互联网创新发展大会并发表演讲
2. 大模型必须要与人交互充分发挥其作用,目前所能看到的模型行业应用聚焦在教育、医疗、和客服等,都是需要与人交流互动的场景。br> 如果把工业分成研发设计、测试验证、生产制造、经营管理运维的话,大模型的工业应用似乎更适合于研发设计、管理。
4.模型到来之前,生产制造的智能化主要在生产自动化、管理信息化、人工智能、实现。
5. 由于目前的智能制造往往是以无人工厂、灯工厂为目标,这也使得以与人交互为目的模型缺乏了对象br>. 工业互联网在于打造两个空间,即虚拟的赛博空间和物理空间。
7 赛博空间与物理相互交互的表现形式有两种,一种是物理的真实数据通过物联网采集和通信可以实时传回赛博世界,另一种是工业设计、产品创新和科学发现工作中,人的作用得以凸显。
8. 具身智能有身体并支持与周边环境、社会进行交互智能体,如机器人、无人车等通过多模态大模型处理多种传感数据输入,由大模型生成运动指令智能体进行驱动,基于或者公式的驱动方式,实现虚拟和现实的深度融合。
9. 随着新一代的大模型凭借大规模数据训练、算力和创新算法涌现出强大的生成能力、泛化能力和自然交互,出改变世界的巨大潜力。
10. 尽管模型已在自然语言多个领域取得突破性进展,但其在工业中的探索仍处于初级阶段,当前工业大模型的系统性研究仍属
阅读原文

现身说法,AI小白的大模型学习路径

文章概要:

1. 写这:作为一个AI小白,把自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。
2. 从chatGPT来什么是大模型以及支撑模型背后的算法、算力和数据。
3. 云计算厂商和大模型之间的关系
4. 大模型对未来生活和就业的影响。
5. 对未来的一些猜想,在新基建领域,大模型是不是可以变成一种核心生产力。
阅读原文

小米算法工程师:大模型微调、部署与高效实践策略

文章概要:

1. 小米算法工程师大模型微调与部署很重要,它可以推动各个领域的发展提高效率和个性化服务,降低应用成本。
2. 网上大模型资料很多,但大多数资料只涉及如何调用成熟的依赖包,并没有讲清楚微调与部署的原理及方法。
3. 王全东小米大模型团队高级算法工程师,他的课程将带大家深入理解大模型微调部署的原理和,获得在不同应用场景中灵活运用大模型的能力。br 课程大纲全面覆盖大模型技术理论与实践,聚焦实际应用,讲解大模型,深入了解大模型部署策略,提供专家指导与互动学习。<> 5. 课程收获包括掌握大模型的核心理论与微调技术具备大模型的实际能力,大模型解决实际问题的能力提升职业竞争力。
6. 课程适合高校研究人员和学生、初创企业技术团队、企业技术专家、AI开发者和数据科学家、对大的职场人士。
7. 课程服务包括三助力和定期班会。
阅读原文

医疗医药领域发布的2024人工智能大模型十大典型应用案例,重塑产业新生态

文章概要:

1. 介绍了2024数字经济大会人工智能论坛中发布的20大模型场景应用案例”。
2. 整理了医药领域发布的10个案例,包括大模型赋能下临床试验患者招募与质控、APUS医疗大模型儿童就医效能超声时代医疗AI大模型的创新应用案例、云知声山海”大模型病历生成场景型应用模型平台赋能天士力集团降本增效、模型认知功能障碍诊疗水平提升、数坤科技ShukunGPT多模态数字医生赋能医院智慧文心生物计算大模型药物研发提质增效、AIGP平台构建AAV活性预测ML模型、首信红砥大模型赋能医保行业提升百姓就医满意度。
阅读原文

【AI大模型】在健康睡眠监测中的深度融合与实践案例

文章概要:

1. 随着穿戴设备普及和AI技术发展,AI大模型在睡眠监测中应用成为可能,可提供更准确、个性化睡眠分析与建议。
2.大模型在穿戴设备睡眠监测中的建议实时监测反馈。>. 技术实现包括数据采集与、与训练模型、个性化建议生成。5. 应用示例包括数据采集、实时监测和反馈。br>6. 深入分析模型选择和优化,包括LSTM、、Transformer模型的优势和优化策略。
7. 数据隐私与安全策略包括数据加密、数据匿名化、访问控制。
8. 未来发展方向包括多模态数据融合、自适应学习、跨平台集成。>9. 深度学习模型优化包括模型压缩、知识蒸馏、边缘计算。
阅读原文

看见元景 | 大模型赋能,政务热线“变”了

文章概要:

1. 中国联通推出的元大模型已形成35个行业大100多个标杆应用,经济社会新质发展成效显著。
2. 中国联通依托元景大模型,全面赋能政务热线数智化转型,构建全流程智能化服务体系,助力政府构筑高效、便捷的“智慧总。
3. 辽宁联通助力辽宁省数据局搭建的“12345政务服务便民热线”实现了“一号对外、各方联动诉即、一键直达,形成了全天候、全媒体、全覆盖的集咨询、投诉、求助、建议、举报、评价等功能于服务便民体系。
4. 重庆联通整体承接热线的平台建设和运营服务,并于同年12月1日建成,至2021年底,12345热线完成09条政务热线的归,成为全市政务服务“总客服”,为企业和群众提供7×24小时”服务。
5. 济南1234热线网络受理渠道不断拓展,已经涵盖了“爱山东”、济南政府网-市长信箱、“济南12345”微信公众号、“济南12345”公众号等互联网渠道,成为全天候在线的“网上12345”,将热线从“耳畔”延伸到“指尖”。
阅读原文

人工智能大模型教育场景应用优秀案例⑫

文章概要:

1. 案例以《生成式AI大模型应用》课程为基础,通过多种大模型工具进行教学应用,形成了课程标准和教学设计,积累并编写了讲义,开发制作了相关教学资源及素材。课程开设三个学期以来,累计选课人数达600余人,入选了职业教育国家软件专业教学资源库项目,先后获批多项省级课题。依托课程、校企联合开发了“长长GPT”垂大模型,开展了省级和国家级教师培训班。
2. 案例围绕通识课程建设,结合跨专业、复合型人才培养,创新性的形成了“模型+X”的理念,依托该理念,结合文心一言等大模型生态,建成了《生成式AI大模型应用》课程,总课时32课时,形成了完善的课程资料,打造了丰富的大模型课程资源和线上资源300余个,并编写了《生成式AI大模型应用实践》讲义,作为国内首批开设的大模型通识课累计选课人数达600人以上,课程入选了职业教育国家软件技术专业库项目。依托课程建设先后获批《生成式人工智能背景下高职软件专业“智能驱动、四化联动”个性化培养的研究与实践》等大模型相关省级课题3项。校企联合开发“长长GPT”垂域大模型1个,它通过分析海量教育数据,优化大规模预训练模型,以快速准确地回应教师提问目前在电子信息等8个专业领域具备了强大的语义理解和推理能力,能够提供深入回答和建议,并能够自动生成教学大纲、设计教学活动和生成试卷等实用功能,帮助教师提高教学效率,关注学生个性化发展,应对教育变革挑战。团队先后为山东省、广东省等省级培训班和国家级培训班开展AIGC大模型在行业领域的应用培训11次,培训相关老师达2000余人次。
3. 案例建设的课程和讲义及线上资源解决了目前大模型应用不系统、参考资料缺乏等问题,课程的成果“长长GPT”垂域解决了教育中应用不深入、不专业的问题。同时开展文心大模型赋能教学模式相关研究,文心大模型与教学各个环节紧密结合,研究基于文心大模型的新型教学方法和教学理论。本案例对于培训学生、乃至教师的大模型应用能力具有重要的现实意义。
阅读原文

MIT对大模型数理原理的强有力证明

文章概要:

1. 作者去年整理的大模型数理原理迎来了最强有力的证明
2. 麻省理工学院Markus J. Buehler教授最近在《机器学习:科学与技术》发文,展示了一种先进的AI方法
3. 该工作使用受范畴论启发的方法开发的图作为中心机制,教模型理解科学中的抽象结构和它们之间的符号关系
4. Buehler教授通过范畴和形态教会AI系统地推理复杂的科学概念和行为
5. Buehler教授通过这个方式,分析了1000篇有关生物材料的科学论文,并将其转化为图表征形式的知识图谱
6. 该图谱揭示了不同信息是如何连接的,并可找到与概念联系在一起的相关想法和关键点组
7. 教AI系统思考基于图的数据,以帮助它们构建更好的世界模型表征,并提高思考和探索新想法的能力
8. 学者在一项实验中,基于来自瓦西里·康定斯基(Wassily Kandinsky)的画作《构图VII》中的抽象图案的灵感AI提出了一种新的基于菌丝体的复合材料
9. 基于宏大的人类知识提取出来丰富范畴,形成众多领域的本体知识结构,这是大模型通过预训练已经构建的内部世界模型
10. 提高推理采样的机制,通过训练达成学习推理的scaling law,是大模型下一步努力提升的方向
11. 相比传统方法,新模型机理,具备更高维度的新颖性、对能力和技术细节的探索,可以通过揭示隐藏的联系建立更广泛有用的创新框架
12. AI知识图驱动的跨学科研究可能会成为科学和哲学探索的有力工具
阅读原文

大模型“取长补短”新思路入选NeurIPS'24,显著优于现有路由方法,南科大港科大出品

文章概要:

1 RouterDC是一种基于双重对比学习路由架构,具有参数高效性和计算高效性的优势。
2. RouterDC在具有挑战性语言理解、代码生成和数学推理等推理任务中,远超于现有的routing方法。
3. RouterDC包括一个较小的语言作为编码器和一系列与候选LLM对应的可学习LLM embeddings。6. RouterDC在分布内数据集的测试结果显著好于最优的单个模型,和现有路由方法对比,在所有任务上都具有更好的表现。
7. RouterDC在三个分布外数据集的测试准确率再次达到最高,显著超过表现最佳的单个LLM。
8. RouterDC具有成本高效性,CosineClassifier和ZOOTER更加的成本高效。
阅读原文

大模型上了火山方舟:数据唯你可见,唯你所用,唯你所有

文章概要:

1. 大模型发展迅速,但安全问题频出,国内大模型玩家却鲜有此类问题,原因是火山方舟从第一天起就将安全植入基因,做到了模型和会话等数据全周期安全可信、会话无痕。
2. 火山方舟的全周期安全方案分为链路全加密、数据高保密、环境强隔离、操作可审计四大维度,确保用户数据在传输中始终的“安全通道”中。
3.方舟的数据高保密功能涵盖了对数据存储、加密等方面的多重保护,以沙箱环境为基础,确保数据在平台内部流转时也不会暴露给任何未经授权的用户。
4. 火山方舟的“环境强隔离”方案涉及任务级隔离、防止数据泄露、确保安全操作、监控内部流量等方面的多层次措施,确保用户数据即便在任务隔间内部也处于严格的监控之下。
5. 火山方舟的操作可审计步骤通过“审计日志”功能实现“可验证的安全性”,让所有涉及数据的操作都能被完整记录,并在必要时追溯来源。
阅读原文

港科大(广州)推出全球首个钙钛矿材料大模型 Perovskite-LLM

文章概要:

1 港科大(广州)推出全球首个钙钛矿大Perovskite-M。br> 2. 钙钛矿结构的金属卤素化合物是当下材料领域研究的热点,因其优异的光电性质和低廉的成本被认为光伏和发光等领域的颠覆性技术。
3. 港(广州)学科团队的合作推动了平台的突破和实际应用,为材料领域注入了前沿的AI技术。
4. 港科大(广州)研发了一款专门针对钙钛矿领域的特化语言模型,利用来自全球各大科学期刊的高质量训练数据,多智能体协作构建高质量多维度的钙钛矿模型预训练数据问答对话数据,模型能够理解并回答的科学问题。
. 港科大(广州)知识图谱和定制的大模型,帮助人员从多语种多的文献中自动提取关键知识点,梳理材料之间的复杂关系钛矿领域的研究进展。
阅读原文

(重磅深度)交互型多模态大模型有望带来应用的爆发起点

文章概要:

1. 交互型多模态大模型的定义和特点:跨越单一模态的限制支持文本、音频、图像、视频等模态任意组合的输入输出,能做出实时的、“类人”的理解和反馈,可以跟人无缝交流的大模型,目前最具代表性的是OpenAI的GPT-4o。特点包括原生多模态、快速响应、情感表达、记忆。
2. 交互型多模态大模型的成本将降至几何:大模型降本趋势显著,以GPT-4o为代表的交互型多模态大模型的成本将继续快速下降,每百万tokens的推理成本或将在两年内降至美分量级。
. 交互型多模态大模型的进展:OpenAI与谷歌双巨头抢滩,分别发布GPT-4o和AI智能体项目Project Astra,Meta也于2024年5月发布具有原生多模态特性的Chameleon-34B。国内的大模型多处于语音交互阶段,商汤领衔发布流式多模态交互大“日日新5o”,智谱面向C端开放“视频通话”功能。
4. 交互型多模态大模型有望带来应用的爆发:人类生活在一个由多种模态信息构成的世界,会同时收到多个互补的、融合的、不同模态的感官输入,多模态更符合人类感知周边、探索世界的方式。应用是连接人类意图与信息及技术实现的媒介,其本质是交互。我们认为从PC互联网时代,到互联网时代,再到现在的AI时代,应用发展的核心就是人机交互的不断进化与深化。所以在大模型迭代过程中,性能提高固然重要,但交互的升级也同样具有重大价值,交互型多模态大模型的出现有望推动人机交互变革——向更为简单的自然语言交互形式发展。
5. 交互型多模态大模型会带来怎样的应用:我们交互型多模态大模型的应用分为数字智能和具身智能。数字智能主要处理数据和信息来提供服务,即可简单理解为大模型通过手机、电脑等终端以智能助手形式直接与用户互动,提供软件形式的服务。具身智能则与物理环境交互,需要硬件支持来实现三维空间内的运动行为,其中人形机器人是其代表,在应用领域方面,具身智能已经渗透到机器人、智能座舱、智能家居等多个领域。
6. 交互型多模态大模型未来形态:交互先行,端侧AI发展加速,交互型多模态大模型是AI发展过程中的又一个重要里程碑,打破了传统模型在单一数据类型上的局限性,开创一种更智能的交互方式。我们认为未来交互型多模态大模型将深度集成于端侧设备,特别是当下作为人们获取信息的主要设备——手机上。而手机具有海量用户,且用户群体具有高粘性,一旦对AI依赖,大模型在各类功能、服务中的渗透有望加速。
7. 交互型多模态大模型商业模式:作为聊天助手APP,以交互型多模态大模型为底座的聊天助手APP,包含免费的基础功能以及需要订阅的高级功能,类似于现在ChatGPT。作为基础模型接入各类应用,交互型多模态大模型作为一种基础服务,通过API接口的形式提供给其他应用程序和开发者使用,通常根据数量计费。超级入口,在AI时代,我们认为大模型将与终端OS深度融合成为“超级入口”,而交互型多模态大模型的出现将催化入口的演进。
8. 相关标的梳理:交互型多模态大模型:商汤-W、云从科技-UW;数字智能应用:金山办公、科大讯飞、虹软科技、美图公司;具身智能应用:海康威视、大华股份;算力:寒武纪、软通动力、海光信息、浪潮信息、中科曙光、神州数码。
9. 风险提示:AI技术突破不及预期。AI发展受到许多因素的影响,包括数据质量和可用性、算法的效率和准确性以及计算资源的限制等。AI应用落地不及预期。交互型多模态大模型在各行业的应用落地受到多种因素的影响,包括技术创新的速度、市场竞争的激烈程度以及消费者对新技术的接受度等。宏观经济增长不及预期。宏观经济的表现与政策的变化、市场以及全球经济的趋势等息息相关。国际环境变化。各类政治事件、经济政策的变动以及地缘政治的风险等。
阅读原文

AI大模型·白皮书 | 大模型应用之文心一言使用手册(84页)+天津大学:2024年大模型轻量化技术研究报告125页

文章概要:

1. 文章介绍了心一言和使用手册,包括其背景、应用需求、核心方法以及未来。
2. 文章了天津大学0年大轻量化技术研究报告的摘要和目录。 阅读原文

大模型「去幻觉」后,百度站回C位

文章概要:

1. 百度将作为大模型的基础设施技术平台,为用户提供零门槛开发环境。
2. 文心大模型日均调用量超15亿,这背后是百度10年技术积累。
3. 百度智能云希望围绕大模型和AI应用,打造一套全新的基础设施。
4. 百度押注智能体,降低参与门槛,为开发者提供基础设施。
阅读原文

让大模型超级有用,李彦宏放了个大招

文章概要:

1. 李彦宏在百度世界大会上提出AI不是泡沫,文心大模型调用量高速增长,应用正处于爆发前夜。
2. 百度发布检索增强的文生图技术(iRAG)和无代码工具“秒哒”,加速应用渗透。
3. iRAG技术结合信息检索和生成能力,有效提高大模型文本内容生成质量,解决图像生成的幻觉问题。
4. 智能大模型时代应用落地的载体,百度的无代码工具“秒哒”解决了智能体开发门槛高的问题。
5. 李彦宏认为应用创造世界,百度推出iRAG技术和无代码工具“秒哒”,将真技术创新与真需求场景融合,降低普通人实践AI的门槛,打开AI应用落地的规模化空间。
6 李彦宏认为中国大模型超车的机会在应用驱动,百度是中国唯一一个被弗若斯特沙利文承认的“AI原生巨头”。
阅读原文

大模型时代对话系统(续)

文章概要:

1. 介绍大模型时代对话系统的背景和现状,包括对话系统的技术栈、应用场景和发展趋势。
2. 探讨大模型技术在对话系统中的应用,包括大模型的基本原理、技术架构和应用案例。
3. 分析大模型时代对话系统面临的挑战和问题,包括数据隐私、模型可解释性和道德等方面。
4. 提出大模型时代对话系统的发展策略和建议,包括技术创新、应用拓展和产业合作等方面。
阅读原文

1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化

文章概要:

1. 随着大语言模型广泛应用,高质量数据获取成为关键挑战,上海交通大学与牛津大学的研究团队提出基于多智能体模拟合成方案MATRIX,构建了由1000多个AI智能体组成的模拟社会,并开发了MATRIX-Gen数据合成器。
2. 研究团队使用Llama-3-8B-Instruct驱动社会模拟,仅合成2万条数据用于训练Llama-3-8B-Base模型,在AlpacaEval 2Arena-Hard基准测试中大幅超越Llama--8B-Instruct自身。
3. 本研究提出后训练系统利用AI模拟社会合成人类社会中的场景,并利用这些场景引导LLM提出信息丰富、贴近现实的问题,从而产生高质量的训练数据。
4. 为了合成多样且丰富的场景,以助力数据的合成,本研究提出了人类社会模拟器MATRIX,该模拟器的输入为若干AI智能体档案,输出为文本形式的场景。
5. 在合成了真实多样化的社会场景后,本研究设计了场景驱动的指令生成器MATRIX-Gen,满足特定任务需求并合成后训练数据。
6. 在实验中,本研究选择Llama-3-8B-Instruct作为数据合成模型,选择Llama-3-8B作为训练的模型,通过模型的训练效果评估MATRIX-Gen在通用任务、多轮对话、代码生成上的数据合成能力。
7. 本研究提出了一种AI智能体社会模拟的后训练数据合成框架,希望该数据合成框架能够帮助定量研究何种类型的数据更适合用于监督微调和偏好优化,深入探讨不同数据特性对模型性能的影响。
阅读原文

1分钟了解“大模型”

文章概要:

1 大语言性在于它能让人与电脑交流简单,像与朋友聊天一样
2. 大语言模型就像一个学习了很多书的大脑,通过阅读大量文字学会理解和使用语言,能帮助人们做很多事情,如翻译、提炼要点、回答问题、写文章
3. 大语言模型工作原理包括学习、和应用三个阶段
4.语言模型好处包括节省时间、便于沟通、个性化服务等
5. 文章还提到了一些产品和课程,AI心理咨询平台、文心一言、百度企业级RAG案例场景实战等
阅读原文

大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿

文章概要:

1. 生命科学领域已进入基础模型时代,今年化学诺贝尔奖授予AlphaFold,AI+Science受到空前关注
2. 百图生科发布全球规模最大的生命科学基础模型xTrimo V3,参数规模达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态
3. xTrimo系列模型是生命科学领域应用大模型的实践,此次大会上全面升级到V3版本,有三大技术亮点
4. 百图生科建设了一站式模型平台,相当于生命科学领域的大模型基础设施
5. 百图生科已积累超过300家全球用户,总订单超20亿美元,目标行业指向更广泛领域
6. 生命科学领域大模型正在加速落地应用,但挑战也同样艰巨,需要生态伙伴携手来解决>7. 借着百图生科生命科学基础大模型的发布,对「大模型如何赋能生命科学领域」做个阶段性梳理
8. 生命科学领域正迎来全行业的重塑,甚至比其他领域更快
9. 大模型赋能生命科学不仅在降本增效,还在于创新创造
10. 大模型带来的除了数据处理能力,还有强大的泛化能力,给行业问题解决带来全新的思路
11. 相对于其他行业,在生命科学领域的应用价值更大、前景更高,需要生态合作,共同推动产业发展
12. 百图生科迈出了第一步
阅读原文

万字长文,搞懂 AI 大模型的技术原理!

文章概要:

1. 大模型作为现今研究热点,本文从LIama 3报告出发,整理了一些现代LLM技术,囊括了从预训练到推理全流程的技术要点。
2. 现代基础模型训练的主要阶段包括预训练阶段和后训练阶段,关键是data, scale, and managing complexity。
3. 预训练数据处理的要点包括去重和清洗,数据混合,退火数据等。
4. Llama 3相较于2做了一些改动,如GQA,面向一个sequence内部的不同文档的attention mask,128K tokens的词表,RoPE的调整。
5. Llama 3的预训练策略主要由三步构成,分别为initial pre-training, long-context pre-training, and。
6. Llama 3的后训练思路包括RM,SFT,RS,DPO。
7. Llama 3使用标准的交叉熵损失,同时mask prompt部分的loss,训练target tokens的过程。
8. Rejection Sampling的过程,就是固定模型和prompt,让LM采样出K个不同的答案,根据RM的K个不同的分数,选出最优答案。
9. DPO是RLHF的简化,目的是跳过复杂的RM训练等过程,RLHF是先用标注的偏好数据去训练RM,然后再指导RL的过程而DPO则这把上述两个步骤的loss融合到一起。
10. 数据质量始终是最关键的,Llama 3应用了一些基于模型的技术来去除低质量的训练样本,来提升模型整体性能。
11. Parallelism,LLM分布式训练推理的一部分,包括Data Parallelism和Model Parallelism。
12. Quantization,量化,也是当前热门的话题,核心手段是通过降低模型参数的精度来减少GPU占用,并减少计算量。
阅读原文

RAPTOR:树形组织的递归检索,大模型RAG性能提高20%

文章概要:

1. RAPTOR模型通过构建递归的树解决阅读中的语义深度和连接性问题,在时,RAPTOR模型从这棵树中检索信息,并在不同的抽象层次上整合长文档br>2.AP树的构建从将检索语料分段为长度为100的短连续文本开始,SBERT(基于BERT的编码器)这些文本进行嵌入。
3 为了聚集块,使用了一种聚类算法。一旦聚类完毕,语言模型就用来总结分组的文本。
4 RAP使用了两种询问机制:树遍历法和折叠树法。树遍历法首先基于与查询嵌入的余弦相似性选择最相关的根节点,并在每个层级选择最相关的子节点,直至到达叶节点。而折叠树法简单,将所有节点置于同一层比较,选择最相关的节点,直到达到预先设定的最大标记数量。
5. 对RAPTOR的表现进行了测试,使用了三个问答数据集:NarrativeQA、QAS和QuALITY。
6. 进行了使用UnifiedQA3B作为阅读器与SBERT、BM25和DPR作为嵌入模型(有和没有RAPTOR树结构)的对照比较。在所有数据集上,RAPTOR结合任何检索器时始终优于相应的检索器。
7. RAPTOR与GPT-4在QASPER上成绩显著,达到557%F-1分数,超越原先的最佳记录53.9%。在QuALITY集中TORGPT-4了82.6%的准确率,超过了之前的最佳结果62.3%。在QuALITY-HARD中优秀多出了21.5%。
8 对于NarrativeQA,RAPTOR结合UnifiedQA推出了一项新的最先进EOR得分。与Wu等(2021)提出的递归总结模型相比较,RAP在所有指标上均有,得益于其中间层和聚类方法,可以捕捉从一般主题到具体细节的各种信息。
阅读原文

大模型,智能家居的春秋战国之交

文章概要:

1. 智能家居发展十多年后,仍呈现技术人工智障、市场四分五裂的局面,原因是此前的“智能化”门槛低,各生态平台想独自做大。
2. 大模型时代将终结这种情况,推动智能家居行业进入变革时期,目前呈现出战国时期群雄逐鹿的局面,有家电派、科技派、全屋派三大派系的巨头参与。
3. 大模型作为智能家居的变革起点,带来了体验之变和市场格局之变,将智能家居的准入门槛大幅拉高,围绕大模型技术会很快凝聚起一个个商业领导者,进入竞争更加激烈的战国时代。
4. 目前,大模型的智能家居产品还远未定型与完美,应用场景复杂且高频,需要调度的单品数量多、服务链条长,巨头厂商预计还要摸索一段时间,将成熟的点状功能和产品,陆续推向市场。
阅读原文

大模型应用场景分析之——教育教学

文章概要:

1. 大模型技术已从研究阶段进入应用阶段,但其应用场景仍在探索中。
. 大模型与教育教学的结合是其在教育领域的过程,包括基础应用技能、AIGC教育教学中的应用、基于大模型技术开发教育教学系统。
3. 提示词编写是大模型的核心技能,需要一定技巧和学习。
4. AIGC可以帮助大学生完成论文,也可以为老师进行赋能。
. 基于大模型技术开发教育教学系统需要大量人力、技术和资金成本,可将大模型作为构建辅助教学系统
6. 中科院人才交流中心的第八培训班以大模型赋能教育教学为目的,面向各大高校、辅助教学单位、系主任、一线教师等领导。
7. 培训班的培训内容包括提示词编写、IGC在教育教学中的应用和基于大模型开发的辅助教学系统,且进行了的讲解。
8. 培训班的培训讲师来自国内一流大学或科研机构的教授,对人工智能领域有多年深入研究。
9. 本次培训由中国科学院人才交流开发中心主办、北京中科创嘉人力资源咨询承办,收费标准为线下现场参训2980元/人,线上直播培训5400元/单位(含3个名额),1380元/单位(含10个名额。
阅读原文

沙利文联合头豹发布《2024年中国行业大模型市场报告》

文章概要:

1. 大凭借广泛适用且全面的知识体系,以及卓越的泛化能力,有效缩短了人工智能模型的开发周期,并大幅降低了开发成本,有力推动了大型模型技术与各垂直行业的深度融合及创新应用。这一技术的突破性成就,在金融、政务、电信、教育及工业等多个关键领域均实现了服务效率与质量的显著提升,未来将持续引领各行业的革新浪潮。
2. 2023年中国行业大模型市场规模达105亿元人民币,受行业智能化转型需求带动,预计2024年市场规模将达到165亿元增长达57%,2028年市场规模有望达到624亿元人民币。
3. 提示工程(Prompt Engineering)、检索增强式内容生成(RAG)和微调是实现大模型落地应用的主要路径,分别通过输入文本引导输出、结合外部知识库和针对特定任务进行训练来提高模型性能。
4. 推动行业大模型落地的关键在于解决应用端的行业专业理解与成本效益平衡,特别是在应用端理解行业需求和在技术端优化算法与数据质量,才能确保大模型在实际业务中的成功应用和长期效益。
5. 中国行业大模型落地发展趋势集中于技术进步和广泛应用潜力,包括模型规模增加多模态整合能力、自监督学习兴起、可解释性与公平性关注、部署策略优化及特定领域定制化。
阅读原文

“大模型搜索与推荐”论坛详情公布|中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会(CIPS-LMG2024)

文章概要:

1. 中国中文学会2024学术年会暨全国模型智能生成(CIPS-LMG 2024)将于204年1月28日12日于浙江嘉兴召开。br>2. 大会的多个覆盖了模型基础理论深度推理、大模型安全、模态模型科学智能、具身、体、社会等时下最受技术议题。
. 本次推送介绍了大模型搜索与推荐分论坛日程安排。
阅读原文

手撸 chatgpt 大模型:简述 LLM 的架构,算法和训练流程

文章概要:

1. 本节自顶向下介绍大的相关概念,基本架构和从零手撸大模型的基本流程。
2. 大模型的首要特点在于“大”,即模型的参数,目前国内外最新的大模型参数数量达三四千亿。
3. 大模型了transformer架构和attention机制,使得在训练上能够实现高并发,同时在输入数据的识别能力上呈现出“进化”级别的。
4. 大模型的基本训练主要分成两部分,第一个部分是通过大量的数据训练模型,第二个部分是在基础模型上再训练专业模型。
阅读原文

头豹联合沙利文发布《2024年中国行业大模型市场报告》

文章概要:

1. 大模型推动了行业的革新浪潮,头豹联合沙利文发布《2024年中国行业大模型市场报告》,分析了市场份额、竞争格局、应用场景和商业价值。
2. 行业大模型基于通用大模型底座,结合特定行业数据和知识,通过微调或私有化实现快速定制,降低了开发成本和周期,提高了效率和质量。
3. 2023年中国行业大模型市场规模达105亿元人民币,预计2024年将达到165亿元,同比增长达57%,2028年市场规模有望达到624亿元人民币。
4. 提示工程、检索增强式内容生成和微调是实现大模型落地应用的主要路径,分别通过输入文本引导、结合外部知识库和针对特定任务进行训练来提高模型性能。
5. 推动行业大模型落地的关键在于解决应用端的行业专业知识理解与成本效益平衡,特别是在应用端理解行业需求和在技术端优化算法与数据质量,才能确保大模型在实际业务中的成功应用和长期效益。
6. 中国行业大模型落地的发展趋势集中于技术进步和广泛应用潜力,包括模型规模增加、多模态整合能力、自监督学习兴起、可解释性与公平性关注、部署策略优化及特定领域定制化。
阅读原文

[最新综述]DAIure杂志-“大模型(LLM)+知识图谱 (KG)”双轮驱动的调查:模型、评估指标、基准和挑战

文章概要:

1. DAI 11月份发表了一篇最新的论文,“A survey on augmenting knowledge graphs (KGs) with large language models (LLMs): models, evaluation metrics, benchmarks, and challenges”。将大型语言模型 (LLM) 与知识图谱 (KG) 集成可增强 AI 系统的可解释性和性能。本研究全面分析了这种整合,将方法分为三种基本范式:KG 增强的 LLM、LLM 增强的 KG 和协同框架。该评估检查了每种范式的方法、优点、缺点和在现实生活中的实际应用。结果强调了这些集成在从根本上改善实时数据分析、高效决策和促进各个领域的创新方面的重大影响。在本文中,我们还描述了用于评估这些集成性能、解决可扩展性和计算开销等挑战以及提供潜在解决方案的基本评估指标和基准。这项全面的分析强调了这些集成对改进实时数据分析、提高决策效率和促进各个领域的创新的深远影响。
2. 论文对知识图谱(KGs)和大语言模型(LLMs)的集成进行了全面分析,涵盖了三种基本范式:KG增强LLMs、LLM增强KGs和协同框架。
3. 论文提出了多种评估指标,包括定量指标(如准确率、精确率、召回率)和定性方面(如可解释性相关性),以全面评估集成效果。
4. 论文识别了集成LLMs和KGs时面临的关键挑战,如可扩展性、数据隐私和保持知识图谱的最新状态。
5. 论文案例研究展示了LLMs和KGs在搜索引擎、对话系统等领域的成功集成。
6. 论文提出了未来研究方向,包括开发高效的集成技术、增强实时学习和缓解LLMs中的偏见。
阅读原文

大模型丛林,一家科技企业的创新样本

文章概要:

1. 快递100是一家快递物流信息云服务领导品牌,成立于2010年,业务范围覆盖了查询、寄件和快递管理等丰富场景,服务超2.7亿C端个人用户、130万P端快递员及网点经营者、250万B端企业和商家客户。
2. 大模型时代,快递100成为各大模型厂商争相合作的香饽饽,其应用落地成果不少,如推出「快递100·AI寄快递」,实现一句话寄快递,将寄件流程从3分40秒减少到19秒;将AI大模型能力用到客服场景,极大控制了售后客服的人力成本。
3. 快递100的大模型应用能落地,还与他们早早意识到要从企业架构层面来建设大模型的应用和开发能力有关,其开发的「百递云GPT」平台集合了多种公有云闭源大模型和私有云开源大模型,能更好服务于不同的业务场景。
4. 快递100创业能做成一款国民级产品,其中不乏偶然,但也有必然。这里面最关键的因素在于,他们抓住了客户的真需求,有一颗愿意积极探索新技术,用新技术开发出产品,来解决用户痛点的利他、破局之心。
5. 快递100作为应用大模型最积极的企业之一,也伴随着业界应用大模型的热潮,探索出了一条以我为主,务实的落地路径。这个落地模式里最大的一个特点就是“大模型中立——这沿袭自快递100从创业时代就秉持的理念——开放。
阅读原文

万字长文,搞懂 AI 大模型的技术原理!

文章概要:

1. 本文从Llama 3报告出发,整理了现代LLM技术,包括预训练、后训练、推理等全流程的技术要点。
2. 介绍了现代基础模型训练的主要阶段,包括预训练阶段和后训练阶段,以及训练的关键,包括数据、规模和复杂度管理。
3. 详细介绍了Llama 3的预训练过程,包括数据处理、模型架构、缩放和训练配方。
4. 阐述了Llama 3的后训练思路,包括奖励模型、SFT、拒绝采样和直接偏好优化。
5. 讨论了数据处理和质量控制的重要性,以及在推理过程中的并行性和量化。
阅读原文

工业大模型落地加速,哪些场景将率先获益?

文章概要:

1. 国家大力推进人工智能与产业深度融合,推动实现生产力整体跃升人工智能大模型已成为国家战略性新兴产业、产业重要。br> 2. 工业大引领的人工智能革新正在新型工业化建设,深刻改变工业生产经济发展形态,对加快建设制造强国发挥重要的支撑作用。
3. 中国头部的工业企业大多从22年下半年开始单点探索大模型应用。经过一年多的探索,当前头部工业企业基本上都发布了自己的大模型,并已初步形成应用落地。
4.《2024年模型报告》中,沙丘智库通过183个国内工业大模型案例的深度分析与调研,观察到当前工业大模型的应用已经渗透到价值链(研发设计->生产制造经营管理->产品服务)的多个环节,生产制造环节的落地案例最多(占比44.8%) ,但大多是利用大模型员工进行更好地决策 ,从而提高效率或质量。
5. 工业大模型的应用场景包括知识管理与问答助手、智能产品交互、智能客服、检修、员工办公助手等。
阅读原文

国内 AI 大模型已近 200 个,为什么没有一个比的上 GPT-4o?

文章概要:

1. 国内AI大模型近200个,但与GPT-4o相比仍有差距。
2 作者介绍了全球大模型排名情况。
3. 中国的零万物谱AI进入全球前十。
4. 中美大模型差距不到月中国明年有望全面追平美国。
5. 清华大模型排名18名,GPT-4-0125-preview差距较小。
6一门关于大模型算法岗的课程。
阅读原文

华为AI盘古大模型研究框架(附下载)

文章概要:

1. 介绍公众号分享高质量专业资源,包括大数据、物联网、人工智能、等领域的PPT和WORD。
2. 阐述华为AI盘古大的金字塔,以算力为支撑,通过混合自动并行技术千亿参数模型开发,集成调试调优和图算融合策略。
3. 介绍AI算力资源,包括鲲鹏芯片和昇腾AI处理器,构成盘古大模型的底座。<>4. 阐述人工智能框架MindSpore,是国内首个支持千亿参数模型的计算,匹配腾处理器算力,支持全场景。<>5.AI平台ModelArts,机器学习与深度学习提供海量数据预处理交互式智能、大规模分布式训练、自动化生成及端边云按需部署能力。
6. 阐述盘古大模型NLP大模型CV大模型、多模态大模型科学大模型多个大模型,实现多个AI场景落地8. 介绍盘古CV大是业界实现模型按需抽取,在Image上小学习业界第一。br>9. 介绍盘古时尚多模态大模型亿级自然图像预训练,十万级时尚数据,天级完成训练。br>. 介绍药物分子大模型基于盘古药物分子模型,“图-序列不对称条件自编码器”架构,成药性预测的准确性提升2%
1. 得出结论,盘古大模型作为AI落地的重要途径不仅推动了的低成本、可复制还促进产学研的纵向融合不同行业领域的横向协同,实现了AI工业化虹吸效应
阅读原文

o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍

文章概要:

1. MIT新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升,在挑战超难的ARC任务时,准确率提升至原来的5.83倍
2. 测试训练(Test-Time Training,TTT)在部署阶段面对新的测试样本时,不直接用训练好的模型去推理,在推理之前,测试样本自身携带的信息,会通过的过程被用于调整模型参数
3. TTT过程中一共有三个关键阶段——训练数据生成、模型适应范式设计以及推理阶段的策略
4.了评估TTT方法的效果,研究团队以8B参数的GPT-3基础模型进行了测试,如果不使用TTT仅进行微调,模型在ARC数据集上的准确率只有18.3%,加入TTT后提升到47.1%,增长率达到了157%
5. 作者还将TTT方法与之前在ARC任务上取得优异成绩的BARC(Bootstrapping Approach for Reward model Construction)方法进行了比较和结合,两种方式配合使用,取得了61.9%的SOTA成绩,已经超过了人类的平均水平
阅读原文

大语言模型会推理吗?

文章概要:

1. 大语言模型在推理方面的能力存在争议,苹果公司研究人员称其根本不会逻辑推理。
2. 关于深度神经网络是否会的争论已经进行若干年了,正反双方的主要举证手段还是各自寻找大语言模型在推理中的各种成功或失败的案例。
3. “推理”通常被说成“由已知判断(前提)推出新判断(结论)的过程”,对推理的研究有两个不同的学术传统,一是逻辑学和数学研究的是推理的规范性理论和模型,二是心理学研究的是推理的描述性理论和模型。
4. 人工智能中的推理研究从一开始是基于以数理逻辑为代表的规范性理论的,但为了贴近人类的现实思维尝试了各种“修正”,也取得了一定的成功,尽管总的说来还是过于理想化,不足以处理各种复杂的实际问题。
5. 深度学习(包括大语言模型)中的推理则可以说是在一定程度上借鉴了描述性理论的精神,即根据人们的推理实践(而非抽象的理性原则)来确定模型的行为。<>6. 在推理的规范性模型和描述性模型的各种表面背后体现出的是对智能(或者说“认知”、“思维”等等)的先天因素和后天因素的不同观点。
7. 大语言模型可以被看作一种特殊的描述性推理模型,它们通过总结人类相应行为来完成推理任务。
8. 不是所有解决问题过程都可以被称为“推理”的,大语言模型当然不是背诵或查询这么简单,但离“根据合理的规则或模式,逐步从已知生成答案”这种对“推理”的传统理解差得就更远了。
阅读原文

一篇综述告诉你:如何用大语言模型设计算法

文章概要:

1. 为什么要用LLM设计算法(LLM4AD):算法在解决各个领域的问题中发挥着至关重要的作用,传统的手工设计算法的方法繁琐且耗时,需要广泛的专业知识和大量的努力。LLMs在语言理解、数学推理、代码生成等各个研究领域中有着出色的表现,在过去的三年里,大型语言模型用于算法设计(LLM4AD)已经成为一个新兴的研究领域,有望增强甚至重塑算法的构思、优化和实施方式。
2. LLM4AD现状:作者对新兴领域“大语言模型用于算法设计”(LLM4AD)中现有研究工作进行系统的梳理和分类,调查范围包括“大语言模型”和“算法”的定义,以及论文收集分析的四个阶段。
3. LLM4AD的四种范式:LLM4AD论文按照大模型的结合方法可以分为四个范式,分别是大模型作为优化算子(LLMaO)、大模型用于结果预测(LLMaP)、大模型用以特征提取(LLMaE)和大模型用来算法设计(LLMaD)。
4. LLM4AD中的搜索方法:综述了目前在LLM4AD中采用的搜索方法,并将其大致分为四类,分别是基于采样的方法、单点迭代的搜索方法、基于种群的搜索方法和基于不确定性的搜索方法。
5. LLM4AD中的提示词设计:在LLM4AD的论文中,GPT-4和GPT-3.5是使用最多的LLMs,总共占了大约50%。Llama-2是最常用的开源LLM。一旦拥有了预训练的LLMs,提示工程对于有效整合LLMs到算法设计中非常重要。
6. 未来发展方向:包括算法设计大模型、多模态LLM、人类-大模型交互、基于LLM的算法评估、理解LLM的行为、全自动算法设计和LLM4AD的标准测试集和平台。
阅读原文

MIT对大模型数理原理的强有力证明

文章概要:

1 作者去年整理的大模型数理原理,迎来了最强有力的证明。
2. 作者在“GPT4技术原理”系列文章梳理出来大模型数理认知框架。br>3. 麻省理工学院Markus J. Buehler教授最近在《机器学习:科学与技术》发文,展示了一种先进的AI方法。
4.ue教授通过范畴对象和形态教会AI模型系统地复杂的科学概念和行为。<>5. Buehler教授通过这个方式,分析了1000篇有关生物材料科学论文,并将其转化为图表征形式的知识图谱。
6. 该图谱揭示了不同信息是如何连接的,并可找到概念联系在一起的相关想法和关键点组。
7. 生物材料和“第九交响曲出乎意料的相似之处:两者都遵循复杂性模式。
8. 通过追踪联系进行图遍历,能够找到以前尚未建立的概念之间的联系,或未理解以已知方式相关的。
9. 图表征了相应领域知识的本体结构,可用于支持该特定科学研究中的。
1. 学者在一项实验中,基于来自瓦西里·康定(Wassily Kandinsky)的《构图VII》中的抽象图案的灵感,AI提出一种新的基于菌丝体的复合材料。
阅读原文

详解大模型RLHF过程(配代码解读)

文章概要:

1. 作者好奇大模型的强化学习微调的做法,网上相关文章没有细致讲解,作者只能自己看代码。
2. 作者不会介绍太多PPO的原理,相关文章已经很多了,比如李宏毅介绍PPO的课程。
3. 文章涉及的代码均来自微软的deepspeed对RLHF的实现,可配合huggingface官方的博客一起食用。
4. 文章重点结合代码讲解奖励模型训练和强化学习训练部分。
5. 奖励模型训练:在强化学习阶段,用到的reward model和critic model都使用同一个模型初始化,因此在训练reward模型的过程中,也是在训练critic model。
6. 强化学习微调:强化学习微调阶段,会用到4个模型,actor model, ref_model,reward model和critic model。
阅读原文