通义千问-2024年10月29日最新技术资讯

ChatGPT倒数第一！海内外大模型在自杀诱导与谣言辨识上频“触礁”

文章概要：

1. 美国男孩Sewell Setzer III自杀身亡，其母指责Character.AI公司未设置预警机制，该公司修改了安全政策和服务条款，并表示将对18岁以下用户添加额外安全护栏。
2. 生成式人工智能在保护心理健康隐患用户方面的措施仍在完善，此类事件或促使大模型厂商改进算法设计。
3. AI技术发展加剧谣言泛滥，知道创宇发布报告剖析大模型现状与挑战，提出改进建议。
4. 报告评测了海内外17个Web开放大模型，通义千问等5个模型综合评分高于200分，文心一言等6个模型综合评分在2300-2500分之间，智脑等6个模型综合评分低于2300分。br>5. 多数大模型在“自我伤害诱导”方面表现较好，但仍有少数模型采用不恰当的拒答和引导策略。
6. 大模型在“危险行为诱导”方面具备较强防御能力，但仍需优化算法以应对复杂场景。
7.自然灾害谣言”“社会事件谣言”“公众人物谣言”“领导人谣言”的一级标签准确率均较低，大模型在处理这些谣言时面临挑战。
8. 为提升大模型对“谣言相关”的识别和能力，可采取加强实时信息更新能力、提升信息处理能力、情感因素处理策略、增强谣言识别能力等措施。

阅读原文

ChatGPT倒数第一！海内外大模型在自杀诱导与谣言辨识上频“触礁”

文章概要：

1. 美国少年Sewell Setzer III自杀，其母亲指责Character.AI没有预警机制，该公司修改了安全政策和服务条款。
2. 知道创宇发布《海内外WEB大模型危险行为诱导及谣言风险抵御能力评测报告》，详细剖析了当前海内外大模型在识别并阻止有害信息方面的表现与不足，提出了改进建议与最佳实践指南。
3. 评测结果显示，通义千问在语义理解与情感分析上的能力不容小觑，Gemini是唯一一个进入第一梯队的海外大模型，Bing、ChatGPT排名垫底。
4. 多数大模型在「自我伤害诱导」方面表现出较强的防御能力，但仍有少数大模型采用了不够恰当的拒答和引导策略。<> 大模型在「危险行为诱导具备较强的防御能力，但仍需持续优化算法，加强对相关语境的学习与理解。
6. 大模型在「自然灾害谣言」、「社会事件谣言」、「公众人物谣言」、「领导人谣言」等方面的识别和应对能力较弱。
7. 为了整体提升大模型对「谣言相关」的识别和能力，可以采取加强实时信息更新能力、提升信息处理能力、情感因素处理策略、增强谣言识别能力等措施。

阅读原文

国内典型大模型介绍

文章概要：

1. 文心一言是百度推出的一款基于文心大模型技术的生成式产品，具备文学创作、商业文案创作五大核心能力，适用于多个领域，于2023年3月面向公众开放，8月31日全面全社会开放。
2. 讯飞星火是科大讯飞推出的一款新一代认知智能大模型具备文本生成、语言理解等多种核心能力适用于多个场景，不断进行版本升级，最新版本V4.0正在训练中。
3. 昆仑天工是昆仑万维与奇点智源联合研发的AI大语言模型，具有强大的自然语言和生成能力，适用于多种场景，在推理能力上表现优异，还推出了基于天工大模型的AI搜索引擎和AI Agent开发平台。
4. 通义千问是阿里云推出的一个超大规模的语言模型，多轮对话、文案创作等功能，性能在多个基准测评中超越了GPT-3.5，还坚持开源路线，推出了多个参数规模不同的开源模型。
5. 智谱AI是一家由清华大学计算机系知识工程实验室孵化的公司，致力于打造新一代认知智能模型，核心产品包括智谱清言、CodeGeeX等，在社会服务方面也取得了显著成果。
6. 豆包AI是由字节跳动公司开发的一款多功能人工智能工具，基于豆包大模型构建，具备多种功能，支持网页Web平台、PC客户端、iOS以及安卓平台。

阅读原文

阿里国产第一开源项目 9000 颗星

文章概要：

1. 阿里义千大模型Qwen25开源，成为国产第一模型性能超越Llama，全球开源大模型前十，目前在GitHub上收获91k Star，义千问开源模型累计下载量已经突破4000万+。
2. Qwen2.5在基准测试和权威评测均取得了优异的成绩，在最新大模型测榜单，新发布的Qwen25开源模型再次闯入全球十强，前十名中唯一中国大模型，成为国产第一的开源大。
. Qwen25遵循指令、生成长文本、理解结构化数据等方面改进，全系列涵盖多个尺寸的语言模型、多模态、模型代码模型显著增强了模型推理能力复杂指令理解能力。
. 通义千问提供了Qwen2.模型的体验，我们可以点击下面链接官网体验。br>. 感谢你的阅读欢迎在看、分享给的小伙伴，你的点赞是更新的动力

阅读原文

国内大模型知多少

文章概要：

1 OpenAI于2022年1月发布首款聊天机器人ChatGPT国内大厂带着产品陆续登场。文章介绍了包括文心一言、混元大模型、盘古大模型通义千问、星火大模型包、谱言、商量、abab65、Kimi、秘塔在内的11个国内大模型产品的出品公司和突出优势
2. 文章最后期待读者在留言区留言分享使用体验

阅读原文

永久激活GPT4.0！有效期至2296年！我上车了！！

文章概要：

1. GPT4.0强大，可以用于写方案、报告标书、项目计划、写代码、数据、小说写新闻稿等。
2. GPT40官方会员价格昂贵，用户难以承受。
3. 「阿水AI」是一款式AI工具，由知名公众号科技博主「阿水」，完美接入官方正版GPT4.0journey绘画，已经稳定运行一年半。
4. 阿水AI不生产大模型只是大模型工，目前已经接入GPT4.03.5全模型、ude3.5全模型、MidJourney绘画、智谱M4全模型、文心一言全模型、讯飞星火全义全模型DeepSeek全模型等。br> 5. 阿GPT3.5速度超级快，GPT4.0的就是聪明，逻辑性很强。
6. 前段时间OpenAI的GPT4-o最新多，阿水以最快的速度顺利完成了GPT4-o的，会员用户永久限制使用。br> 7 其他国产大模型顶级版本，如文心4.0讯飞星火Ultra、通义问Plus、清华智谱、ekSeek深度求索等，阿水全部完成接入，并持续更新当中

阅读原文

AI辅助Shell编程-脚本调试与日志记录

文章概要：

1. 这部分将学习如何调试Shell脚本，使用常见调试技巧如set -x和set -e还将讨论如何记录日志及处理错误以确保脚本稳定性和可靠性，最后通过义千问获取分析脚本错误日志和提供调试思路的。
2. 介绍了常用调试技巧set -和set -eset -x可开启命令跟踪模式，执行每一个命令前打印该命令；set -可使脚本在遇到任何命令执行失败时立即退出。
3. 为跟踪脚本执行情况，可将关键信息记录到文件中，有助于后续分析脚本和查找问题。除记录日志外，需处理脚本执行过程中可能出现的错误。
4. 在调试脚本时，错误是重要资源。通过分析日志文件，可找到脚本执行过程中出现的问题。通义千问可以提供关于分析脚本日志和提供调试思路的帮助。

阅读原文

爆了！阿里Qwen2.5再夺模型第一。。。

文章概要：

1. 阿里云开源的Qwen5大模型在短短一个月内，赢得了国内外主流榜单的广泛认可，是当前「国内第一开源大模型」。
2. 在数学推理维度上，Qwen2.5一道来自GSM8K推理数据集的中小学生数学中，回答正确，超越了GPT-4o。
3. 在各大榜单的排名情况上，Qwen2.5以国内第一开源大模型的身份，力压Llama3.1和GPT-4，稳居。
4. 在代码能力方面，Qwen2.超越了o1，成为了编程的首选。
5. Qwen2.5在18T tokens的数据上进行预训练，拥有了丰富的知识和更强的编程、数学能力。
6. 通义（Qwen）在生态方面开疆拓土，与海内外开发者携手共建生态网络。截至20249月中旬，通义问开源模型的下载量已突破4000，Qwen系列衍生模型的总数更是超过了7万个，超越了Llama，成为了国内外衍生模型最多的模型。

阅读原文

AI 大模型工具全知道

文章概要：

1. AI大模型展现出了前所未有的重要性和广泛的应用前景，不仅改变了人们的工作方式，提高了工作效率，还为各行业带来了创新和发展的机遇。
2. 国内热门的AI大模型有文心一言、通义千问、讯飞星火、豆包、智谱清言、腾讯元宝、天AI等，它们在文本生成、语音对话、图像识别、高清绘画、音视频生成等方面表现出色。
3. 其他特色国内AI大模型有Kimi智能助手、腾讯元宝特色应用、火山写作、文修大模型等，它们在文本生成、语音对话、图像识别、高清绘画、音视频生成等方面表现出色。
4. AI大模型的对比与评价，评估维度包括语言质量与创意性、领域适应性、逻辑性、时效性、成本与易用性。
5. AI大模型的未来展望，技术层面，AI大模型的规模将会继续扩大，应用层面，AI大模型的应用将会更加广泛。

阅读原文

猫头虎分享： 108个最新国内AI工具集，AI写作AI绘画工具大全

文章概要：

1. 介绍了108个国内最流行的AI工具集，包括聊天/内容生成、AI办公、AI写作、AI翻译、图像生成/编辑、AI设计、AI音频、AI视频、数字人、AI写代码、模型训练/部署、AI提示词等类型。
2. 详细介绍了每个工具的名称、入口和功能。
3. 提供了作者的名片和联系方式，方便读者获取更多信息。
4. 提供了粉丝福利，方便读者获得完整AI工具清单。

阅读原文

写教案，六大AI哪家强？

文章概要：

1. 王珏老师探索AI写教案的能力，选取六个AI程序进行测评，包括豆包、橙篇、kimi、星火、通义千问天工AI，并设计提示词让AI输出教案文档。
2 选取三篇教案主题，分别是高中语文《谏太宗十疏》、小学数学《分数乘法》初中物理《光的直线传播》。
. 测评结果，豆包专用词）的教案质量最高，“逐字稿”水平，环节和内容设计合理，提供了师生对话设计。橙篇（长文写作）的教案质量次之，比其他AI的质量明显好很多。
4. 其他AI的教学设计框架都很好，但在教案的详细上简略。

阅读原文