我的梦想
不是每个人都应该像我这样去建造一座水晶大教堂,但是每个人都应该拥有自己的梦想,设计自己的梦想,追求自己的梦想,实现自己的梦想。梦想是生命的灵魂,是心灵的灯塔,是引导人走向成功的信仰。有了崇高的梦想,只要矢志不渝地追求,梦想就会成为现实,奋斗就会变成壮举,生命就会创造奇迹。——罗伯·舒乐
为什么强化学习算法不需要标注 为什么强化学习算法不需要标注
在强化学习中,Bootstrapping和无标注样本训练是其区别于监督学习的核心特性。以下通过分层解释来理解这一机制: 一、什么是强化学习中的 Bootstrapping?Bootstrapping(自举)指模型在更新时依赖自身的当前估计
2025-04-10 jasme
Qwen2.5-VL-模型部署遇到的问题和解决方法 Qwen2.5-VL-模型部署遇到的问题和解决方法
Qwen2.5-VL-模型部署遇到的问题和解决方法 一、Qwen2.5-VL-模型介绍最近遇到了一个根据图片生成描述的项目,之前使用过Qwen-VL 1.0 ,当时测试效果感觉还可以,当时还在一些任务上做了微调,后来它不更新了,我也转到其他
强化学习中值迭代算法的实现 强化学习中值迭代算法的实现
强化学习中值迭代算法的实现重点算法实现的重点是理解:值迭代算法和策略迭代算法都是交替进行value update和policy update,来求解最优策略。两个策略的原理具体可以参考文章什么是值迭代和策略迭代算法? 一、算法通俗讲解目标
面试必问-Attention为什么要除以$\sqrt{d}$ 面试必问-Attention为什么要除以$\sqrt{d}$
问题: Attention计算中为什么要除以$\sqrt{d}$?标准答案为了避免当d的值较大时,点积结果变得过大。如果不进行这样的缩放处理,过大的点积值会使softmax函数的结果趋向于极端值,进而导致梯度消失的问题,影响模型训练的效果。
文章速读-2023年10月15 文章速读-2023年10月15
文章速读-2023年10月151. 《问答场景常用大模型解决方案》原始链接 https://mp.weixin.qq.com/s/rojniYJ3PViO3uix0hIKFQ 文章概括LLM落地智能客服中的问题和解法。 1、落地有哪几种方案
leetcode-逐行讲解-链表反转 leetcode-逐行讲解-链表反转
leetcode-逐行讲解-链表反转题目 https://leetcode.cn/problems/UHnkqh/description/ def reverseList(head: ListNode) -> ListNode: #
社交网络账号挖掘系统设计-part1 社交网络账号挖掘系统设计-part1
系统概览一、针对的需求很多社交媒体平台(Social Media Platform,简称SMP)都存在创作者拉新的需求,通常是需要获取某个垂类下的创作者,比如说:PM:我们主打搞笑社区,希望获取ins上的搞笑作者,让他们在我们的社媒平台进行
算法工程师面试考点思维导图 算法工程师面试考点思维导图
梳理总结了算法工程师面试考点思维导图
vim8 编译安装 vim8 编译安装
vim8 编译安装1. 引子开发机上的vim 版本太低,我也没有sudo权限,只好编译安装vim8 2. 安装步骤Step 1:下载vim的源码git clone https://github.com/vim&
1 / 2