行业新闻

在播放新版本的DeepSeek R1之后，外国网民再次居住

作者: bet356亚洲版本体育点击次数: 发布时间: 2025-06-05 10:32

几天前，没有热身或新闻发布会，DeepSeek以低调的方式上传了DeepSeek R1（0528）的更新。最关注的海外是，DeepSeek更新将幻觉率降低了几乎45％-50％，并将R1的性能推向了OpenAI O3和Google Gemini 2.5 Pro的水平。同时，一些海外开发人员和人工智能研究人员已经开始运行基准，并热情地讨论了其在社交媒体平台上的新功能，尤其是与Giant Tech的旗舰模型的差距。从最近几天的海外用户的反应来看，尽管DeepSeek的更新并不像今年年初发布时那样意识到，但它仍然使许多外国网民说“ Goen Mei ying”，并且它也使更多的人向Belis超越了最强大的所有权，这些模型来自中国各种能力的各种AI AI能力？ 1 DeepSeek再次在所有类型的AI社区中再次“顶”，Reddit平台具有许多子社区r兴高采烈至AI/LLM。其中，在R/Localllama和R/Sillytavernai等社区中，有许多热门帖子可以更新DeepSeek。 “新的 - 熟练的DeepSeek R1的播放几乎与O3 OpenAI模型相当于Livecodebench！在Open Resource中取得了巨大的成功！”用户的标题已发布了帖子。 Reddit社区有关DeepSeek更新的帖子|图像来源：Reddit一些开发人员测试了最新的R1功能。他们主要在数学和编程问题上赞美R1的性能，尤其是在处理复杂的积分或递归功能时。与以前的版本不同，R1-0528具有“更长期的思维能力”，一些测试人员被教导说它“表达主动性”和“不要迅速放弃”。 “只是尝试了……我有一条高度复杂的代码1200行，并添加了新功能……看来代码质量在O3级别……我可以说哇。”这被称为Reddit社区R/Localllama中的常驻用户。 Reddit社区对DeepSeek U的回应PDATE ｜图像来源：根据官方的DeepSeek声明进行重新播放：“更新的R1模型在许多基准评估中，在所有国内模型中获得了良好成绩的最高排名O3和O3和O3 Gemini-2.5-Pro。在功能方面，新版本显着改善了模型思维和推理的深度，并支持工具呼叫。其他型号|。S已更新和改进。 R1的主要优点之一是上下文的持久性和耐用性。 AI游戏社区（通常在AI模型测试的边缘，但与对话有关）坚持认为，职责记住过去的微妙细节和响应自主行为。一位用户告诉r/sillytavernai：“一个角色与我争论了一种观点，并提到了过去的三个细节。” “我还没看过。”用户还指出：“ AI通常不主动；我训练了一些AI来主导对话，但这是我第一次看到AI从游戏场景中出来。” Reddit社区中的另一位用户发布了更新的DeepSeek R1 0528在他的所有试验中都获得了全部分数。 “过去的几周令人眼花ni乱 - Openai 4.1，Gemini 2.5，Claude 4-他们都表现良好，但他们都没有在每个审判中获得完整的印记。DeepSeek R1 05 28是第一个这样做的模型，“他说。 Reddit社区帖子有关DeepSeek更新|图像来源：Reddit“这些测试是许多人在YouTube上进行的不现实试验。例如，草莓中的RSS数量或编写蛇游戏等。用户说。我很欣赏（在这里的双关语），但是我有点麻木，很难找到描述它的正确词。这是一个来自一个实验室的免费开放资源模型，该实验室不知道，该模型确实比削减商业模式更好。” X与Reddit社区一样活跃。除了通过基准图表外，有些人还具有Deptseek编程功能。是R1 ... Deptseek R2会非常疯狂。 “ DeepSeek更新帖子X |图片来源：X除了用户的声音和开发人员之后，Deviceek发布了更新后，智能模型的人工评估机构人工评论说，DeepSeek的R1“元和人类”在独立的“智能索引”中说。人造索引人工智能|照片来源：根据特定模型的人工评论，该机构在一份报告中指出：“ DeepSeek R1比Xai的Grok 3 Mini（高）更明智，NVIDIA的Llama Nemotron Ultra，Meta 4 Maverick，Alibaba的QWEN 3 253 253，并且与Google的Google的Gemini 2.5 Pro相当。点），livecodebench（代码生成，+15点），GPQA钻石（推理推理，+10分）和人类的最终考试（推理和知识，+6点）在编程方面，审查机构认为“ R1在索引分析的手动分析中可与o3背后的索引分析中的Gemini 2.5相当”。变化的智能索引主要制造商的RT人工智能模型|图片来源：关于OpenAI比较的人工分析，该机构说：“ DeepSeek仅证明他们可以保持扩大OpenAI RL计算能力的速度。”当然，不可能赞美一切。 In terms of programming capabilities, there are also X users who picky, "If you actually write code with it and Claude 4, you will know that the benchmark description is inaccurate. Posts on X about theDeepSeek updates | Image Source: X Another user overseas in X said, "Deepseek may be a math and logic (standard-of-the-art) sota, but I still use Gemini 2.5 Pro, because it has a huge context." For this issue, DeepSeek在其官方文章中提到，用户需要通过其他第三方平台的R1-0528模型进行128K上下文，但是，一些海外用户认为，如果他们在所有测试中都赢得了第一名，那么R1将拥有相同的低成本，开放的体重和强大的性能 - 许多好处将被“合并”。关于“很少的更新”，DeepSeek今年早些时候推出，它导致了美国股票市场的海啸，Reddit用户开玩笑说：“请首先出售我的AMD和NVIDIA股票。请让我提前三天告诉我。“一些网民开始以另一种方式来赞美DeepSeek的“低调”姿势。一个雷迪特的网民发表了很长的评论，说：“在0528上，他自己的话：他自己的话：低 - keye deptseek的效率包含了一首诗。其他人则仔细地计划了充满期望的大交响曲 - 主题演讲中的豪华演讲，精心设计的演示，DeepSeek的声明给了一个安静的十四行诗。希望你喜欢它。 ”“对Iyong竞争对手的无声打击是最新的。 “下面的另一个网民说。有关DeepSeek更新的Reddit社区帖子|图像来源：Reddit 2“开源的巨大成功”除了其功能之外，还根据国外的互联网反应来判断，这是一个Mong Deptseek的许多好处，开发人员仍然是“开放资源”，或者更确切地说是“开放权重”。由Y组合人组成的在线技术社区Hacker News出现，主要分享基准结果，共享经验以及R1性能改进，尤其是在编码和数学方面的验证。但是与此同时，上面还有很多讨论仍然围绕着人工智能中的“开放资源”展开。许多人赞扬Deviceek在公共公共模型中的重量，但他们还继续指出，外面没有人能够预防或完全验证R1，因为培训数据等尚未发布。此外，尽管它是开放资源并且免费的，但具有6710亿参数的R1本质上是一个巨大的模型，对于普通用户而言，它太大了。虽然今天，R1和Chatgptang比较之间的比赛已成为标准。 Openai A OPENAI可以完全访问普通用户的顶级型号，或者某些定价觉得用户有用，而Deviceek则提供便宜并提供下载的模型权重。 “ DeepSeek是真正的开放AI”在国外用户帖子的标题说。 DeepSeek更新的Reddit社区帖子｜图像来源：Reddit当然，并非所有Reddit用户都完全接受。一篇题为“ DeepSeek有多糟糕？”的帖子。已经引起了有关DeepSeek内容内置审查的讨论，并且该模型对“避免”某些问题不满意。这种类型的论点已成为一个常见的“备忘录”，一些用户会否认该模型是重型的，如果开发人员认为这是偏见，他们可以自己修复它。此外，世界上主要模型目前具有内容过滤机制，但特定选择是不同的，西方政治准确性也是如此。在Reddit中，还有一个热门帖子，标题为“开源人工智能获取！”，正如海报所说，Deptseek似乎是成为唯一在模型切割场上真正竞争的公司。其他公司始终可以保留，因为Qwen不愿意开放其最大型号（Qwen-Max）的资源。 “近乎源的人工智能公司总是说，开放的模型资源无法抓住它们。没有DeepSeek，它们可能是对的。但是感谢DeepSeek成为异常现象！”有关DeepSeek更新的Reddit社区帖子|图像来源：在本文下面的评论部分中，有一个尖锐的回应说：“他们这样做是因为最好的情报是驱动革命，而公众将铭记DeepSeek是人工智能的真正先驱，而不是Google，封闭的，封闭的或虚假的人类安全性，在世界上充满广告。” Reddit社区对DeepSeek更新的回应|图像来源：REDDIT用于DeepSeek Update，R/Localllama社区中提到的永久用户：“这使我想起了Onlectai的承诺发布“ O3-Mini级别模型”，但是无法实现它。现在，新的R1超过了许多人的O3米尼（高），并且接近完成O3（高）。 “安全”只是一个道德原因。每当我不得不等到所有营销gi头时，我都可以进行全面审判。毫无疑问，这是一个上升的优势。许多网民已经开始担心自己的命运，例如“ DeepSeek将继续迫使AI公司竞争降价”。一些网民认为，DeepSeek“并不是所有人都在做利他主义。通过发布免费模型您可以避免竞争对手在市场上取得优势。 DeepSeek上的Reddit社区的帖子是tomage的起源：REDDIT值得注意的是，该行业在DeepSeek更新中仍在发布DeepSeek R2。 Xiang回答。

上一篇：Google YouTube Premium Lite成员自6月30日以来实施了新下一篇：没有了

行业新闻

在播放新版本的DeepSeek R1之后，外国网民再次居住

相关新闻

新闻中心

新闻中心

hg0088