全部标签

新闻资讯

🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 0
- 0
charles25年7月14日
🧠 大模型到底厉害在哪？看完这篇你就懂了！

你有没有想过：我们每天用的 AI 大模型，比如 ChatGPT、文生图的 Stable Diffusion，到底“脑子里”是什么？今天，我们不讲代码、不讲数学，用最通俗的语言带你看懂大模型的“思考空间”到底是什么！⸻🌟 01 | 大模型的大，到底大在哪里？我们说 GPT-3、GPT-4 是“千亿参数的大模型”，这并不只是说“它很复杂”——而是它的“思考空间”特别大。举个例子：人脑里有很多神经元，而…
前沿技术
- 0
- 0
charles25年7月14日
读懂Transformer的层次，了解大模型基石

当你与DeepSeek对话，它能够理解问题并给出恰当回答时，你是否想过这种"理解"是如何实现的？这背后源于一个经典问题：如何让机器将一个序列转换为另一个序列？，也就是Seq2Seq（Sequence-to-Sequence）问题，以及解决这个问题的经典架构——Transformer。 Seq2Seq本质上是一类问题的抽象描述，而不是特定的模型架构，就像"分类问题&q…
前沿技术
- 1
- 0
charles25年7月14日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 0
- 0
charles25年7月14日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 0
- 0
charles25年7月14日
数据库搞 AI 是认知错位，Agentbase 协议才是主角

结论先行： AI Agent 时代，对数据库/数据平台的正确态度是：Let database be database! AI 化数据库不是正路，真正的正路是——让 Agentbase 成为“智能系统的上层大脑”，去调度它们。数据库擅长储存和查询，但我们正在进入一个新的时代：任务不是被查询触发的，而是被意图驱动的。系统不再等待人类写指令，而是 Agent 主动规划、调度、行动。强大的传统数据平台…
前沿技术
- 1
- 0
charles25年7月14日
AI 知识库之 IMA Copilot：最新版本核心功能大全，都在这了！

大家好，我是锐哥，一个在IT界摸爬滚打的老兵，从云计算—>互联网—>金融，从编码—>咨询—>产品，横跳多个领域，经历起起伏伏。在AI时代，希望和大家一起：深入AI，实战AI，分享AI，共创AI。大家对IMA的使用越来越多了，其实这么受欢迎的原因，我个人觉得是太方便了！因为大家的日常社交，甚至工作基本上都在微信上，而那些散落在微信各个角落的文档、图片、聊天记录等到处都是，…
前沿技术
- 1
- 0
charles25年7月14日
“把模型讲明白”，是气象+AI研究中最被低估的能力

在气象与人工智能的交汇点上，我们常常会遇到一个难以摆脱的困扰：为什么我做的研究，别人总是听/看不懂？尤其是在涉及气象数据处理、深度学习模型、时序预测等专业领域时，很多时候，我们的“技术细节”让人眼花缭乱；而我们往往习惯于把重点放在这些细节上，假设听众已经具备了足够的背景知识。但实际上，气象与人工智能的结合本质上属于跨学科的探索，我们的听众/读者往往要么非气象科班出身，要么非计算机专业出身。很多人…
前沿技术
- 0
- 0
charles25年7月14日
月费200刀的AI浏览器，Perplexity Comet的真实体验如何？

AI 浏览器的战争开打到今天，从早期的 Arc 试图重塑交互，到 Opera Neon 展现的「代理」能力，再到传闻中 OpenAI 即将推出的浏览器，每一个行业重量级参与者，都在试图重新定义这个我们最熟悉的互联网入口。本周，以 AI 搜索引擎著称的 Perplexity 终于带着他们的答案入场了——Comet，一款自称为「AI Agent 原生」的浏览器。然而，Comet 并没有在社交媒体上…
前沿技术
- 0
- 0
charles25年7月14日
加速AI落地：开发者必看的三大策略

文章探讨了在软件开发中应用人工智能的策略，强调了人工智能作为工程师的合作伙伴而非替代者的角色。建议通过结对编程框架、分阶段实施方法，以及清晰的沟通和反馈机制，逐步将人工智能融入团队流程，从而提高效率和创新能力。译自：3 Strategies for Speeding Up AI Adoption Among Developers[1] 作者：Sabrina Farmer 虽然人工智能已经展示…
前沿技术
- 1
- 0
charles25年7月14日
一文吃透Dify：Chatflow与Workflow的深度对决

摘要：在 dify 平台开发 AI 应用的过程中，Chatflow 和 Workflow 就像是一对让人困惑的 “孪生兄弟”。初次接触 Dify 的开发者，往往会被它们看似相似的外观和操作界面所迷惑，难以快速精准地把握二者之间的核心差异。就拿客服场景来说，如果错误地选用 Workflow，会出现怎样的状况呢？当用户询问商品的某个细节时，系统给出回答；紧接着用户又询问该商品的使用方法，这时问题就…
前沿技术
- 6
- 0
charles25年7月14日
当AI开始“组团上班”：大模型多智能体协作到底有多牛？

有时候，一个聪明人不如一群“各有所长”的人一起干活。在AI的世界里，这种“组队打怪”的方式，正悄然流行，它有个很酷的名字：Multi-Agent（多智能体）协作。还记得《复仇者联盟》吗？每个超级英雄都有自己的本领，钢铁侠负责科技，黑寡妇搞情报，绿巨人顶近战……他们一起才能打败灭霸。现在，把这些英雄换成大模型驱动的智能体（Agent），你就会发现：AI不再是一个“大而全”的孤胆英雄，而是一个个…
前沿技术
- 0
- 0
charles25年7月14日
首个AI智能体安全测试标准发布，蚂蚁集团、清华大学、中国电信等联合编制

日前，世界数字科学院（WDTA）在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》，标准由蚂蚁集团、清华大学、中国电信牵头，联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外机构、企业及高校共同编制，为全球首个单智能体运行安全测试标准。该标准针对智能体跨越“语言墙”所带来的“行为”风险，首次将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环…
前沿技术
- 1
- 0
charles25年7月14日
Grok-4背后：一场“接近无限算力”的暴力美学革命

点击蓝字关注我们前言当科技圈的目光还聚焦于模型参数的百亿、千亿之争时，一个更野蛮、更纯粹的竞争维度已经悄然拉开帷幕——算力。如果说过去的AI发展是一场精巧的算法竞技，那么随着Grok-4的正式发布，我们正被拖入一个由“无限算力”主导的全新纪元。这不仅是技术的迭代，更是一种“暴力美学”的集中体现：用绝对的力量碾压一切技巧，用无尽的计算资源去逼近智能的终极真相。今天，我们就来深入探讨，传说中的G…
前沿技术
- 8
- 0
charles25年7月14日
有创始人开始收“尽调误工费”了

将投中网设为“星标⭐”，第一时间收获最新推送尽调之前先签一份TS。作者丨王满华来源丨投中网前不久，一位投资人朋友给我分享了一件趣事：某热门赛道的创始人，因为频繁接待前来调研的VC机构，不堪其扰之下提出了“来尽调得先支付误工费”的要求。该创始人还给自己这一决策起了个名号，叫“反向投资模式”。这不禁让我联想到此前因“想尽调先打1000万保证金”而出圈的领存科技。不过与领存当时的“天价”门槛相比…
前沿技术
- 6
- 0
charles25年7月14日
一文讲清楚大模型中8个关键词及原理：LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

点击上方蓝字关注我们什么是大模型？你是不是脑子里浮现的是 OpenAI、ChatGPT、DeepSeek？还有各式各样能跳个舞、可以翻个跟头的机器人？再深入点的，还能说出训练与推理。有没有一种感觉：就是身边的信息都在声嘶力竭的鼓吹大模型正在改变世界？恍惚自己再不学习下大模型，就马上会被世界所抛弃的感觉？如果你有这种感觉，那就对了。因为我曾经也有这个感觉，所以在某个时间、某个瞬间，我就下定…
前沿技术
- 9
- 0
charles25年7月14日
企业新基建：MCP + LLM + Agent 8大架构，将打通AI Agent的“神经中枢”落地实操！

随着AI智能体技术的快速发展，如何高效构建和管理多Agent系统成为开发者关注的焦点。本文将深入解析8种当前最受欢迎的LLM Agents开发框架，并详细演示如何为每种框架集成MCP Server，让你的智能体拥有强大的外部工具调用能力，本文上一篇文章的实操篇企业新基建：MCP + LLM + Agent架构，将打通AI Agent的“神经中枢”。一、什么是MCP Server？ MCP（Mod…
前沿技术
- 8
- 0
charles25年7月14日
聊一聊企业落地LLMOps：生产就绪的大语言模型建设（精品）

0 引言大语言模型（LLMs）的迅猛发展彻底革新了人工智能领域，极大地拓展了机器对语言的理解与生成能力。然而，将这些复杂模型部署并管理于生产环境中，面临着诸多传统机器学习运维（MLOps）方法难以全面应对的独特挑战，由此催生了专门的学科领域——LLMOps。1 LLMOps的“缘起”：一种专业化的应对之道尽管MLOps为机器学习模型的全生命周期管理提供了坚实框架，但大语言模型所具有的独特复杂性，使…
前沿技术
- 7
- 0
charles25年7月14日
智能体Agent这场风暴还能刮多久？

引言在2023年ChatGPT引爆全球AI热潮后，一个更为深刻的技术变革正在悄然发生——智能体(Agent)技术的崛起。从OpenAI发布GPTs商店，到Anthropic、Meta等公司纷纷布局Agent生态系统，再到全球开发者社区涌现出数以万计的自主Agent应用，我们正见证着一个由智能体驱动的计算新时代的诞生。但这场智能体革命究竟是昙花一现的技术泡沫，还是将彻底重…
前沿技术
- 5
- 0
charles25年7月14日
🧠 大模型到底厉害在哪？看完这篇你就懂了！

你有没有想过：我们每天用的 AI 大模型，比如 ChatGPT、文生图的 Stable Diffusion，到底“脑子里”是什么？今天，我们不讲代码、不讲数学，用最通俗的语言带你看懂大模型的“思考空间”到底是什么！⸻🌟 01 | 大模型的大，到底大在哪里？我们说 GPT-3、GPT-4 是“千亿参数的大模型”，这并不只是说“它很复杂”——而是它的“思考空间”特别大。举个例子：人脑里有很多神经元，而…
前沿技术
- 4
- 0
charles25年7月14日
Anthropic官方：Claude Code – 安装配置手册

Claude Code 概述了解由 Anthropic 开发的智能体式编程工具 Claude Code（编者注：这有别于Cursor等聊天式编程工具），目前作为研究预览版处于测试阶段。 npm install -g @anthropic-ai/claude-code 请勿使用 sudo npm install -g，这可能导致权限问题和安全风险。若遇到权限错误，可参考配置 Claude Cod…
前沿技术
- 13
- 0
charles25年7月14日
一文读懂：大模型、智能体、工作流、扣子的核心区别与应用场景

读完约7分钟，掌握AI关键概念，不再在技术讨论中一脸懵逼你是否有这样的困惑：朋友圈都在讨论 ChatGPT、智能体、AI工作流，但你却对这些概念一知半解？会议上大家热议 Coze 空间的应用场景，而你只能假装了解地点头？如果是，那这篇文章正是为你准备的！为什么这些概念让人混淆不清？技术圈有个特点：概念越新，解释越模糊。当我第一次遇到这些名词时，也是一头雾水。网上的解释不是太学术就是太肤浅，严重缺乏…
前沿技术
- 7
- 0
charles25年7月14日
从”猜配件”到”秒匹配”：AI Agent如何让万亿汽配市场告别石器时代？

Agent工作流、模型微调、RAG知识库、多智能体协作等）落地应用——政企数字化转型中的场景。公司创始人，base上海，希望与更多的朋友和校友们合作交流！" data-id="MjM5NjY0MTk4MQ==" data-is_biz_ban="0" data-service_type="0" data-verify_sta…
前沿技术
- 8
- 0
charles25年7月14日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 7
- 0
charles25年7月14日