抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

Hitme Blog

不要停下思考的脚步

一、为什么需要持久化?

LangGraph 把图的每一步执行状态保存成 checkpoint(检查点),解锁了四个核心能力:

能力 说明
Human-in-the-loop 人类可以在任意步骤查看、暂停、修改状态后继续执行
Memory 同一个 thread 内的多轮对话自动保留上下文
Time travel 可以回放历史执行,也可以从任意检查点分叉探索不同路径
Fault-tolerance 节点失败时从上一个成功的 checkpoint 恢复,不重跑已成功的节点

过程比结果更重要如果这个宇宙的结局是注定的,是消亡是归于死寂,那或许说明,只有过程才是最重要的,这是我们能够改变的唯一的事。当你看人类所有的历史,悲欢离合、英雄小人、爱恨情仇,你会不会有这种感觉,似乎我们做什么事其实它都没有意义。人生,从来没有正确的选择,每种选择背后本身就是一场豪赌。我们能够做的或者说应该做的,是享受晴朗的天气,享受路边的风景,享受每一个转瞬即逝的瞬间。

一文读懂大模型后训练(Post-Training) 预训练给了模型”知识”,后训练给了模型”灵魂”。 目录 什么是后训练? 后训练的整体流程 监督微调(SFT) 奖励模型(Reward Model) 强化学习对齐(RLHF / PPO) 直接偏好优化(DPO) 拒绝采样微调(RFT) GRPO 与推理模型训练 各方法横向对比 工程实践要点 前沿趋势 一、什么是后训练?大模型...

前置

  1. InnoDB 存储引擎的每次磁盘IO操作读取或写入的大小是一页(16KB)
  2. B+树索引结构下的每个节点大小就是一页
  3. 树的高度 == 每次查询数据时磁盘IO的次数

一、什么是事务隔离?

事务隔离是指在并发环境下,多个事务之间的操作互不干扰,每个事务都能看到一致的数据状态。

什么是Redis?

Remote dictionary Server,基于内存的高性能键值(Key-Value)存储系统,常被用作缓存中间件。

键入网址到网页显示,期间发生了什么?

输入网址到网页显示,这个过程到底发生了什么,我相信这是初学者很想了解地方。明白这个过程,才能将所学的计算机网络的知识串连起来,而不是孤零零的去学一个点。

什么是网络拥塞?

当网络中的数据流量超过链路或路由器的处理能力时,就会发生:

  • 路由器缓存溢出 -> 丢包
  • 排队延迟增加 -> 高延迟
  • 重传加剧
    TCP拥塞控制的目标就是:在不引起网络拥塞的的前提下,尽可能高效的利用带宽

TCP三次握手

为什么是三次握手?

  • 双方都得确认建立连接
  • 防止历史的连接请求造成混乱

HTTP

HTPP:Hyper Text Transfer Protocol,超文本传输协议,定义了客户端与服务器之间说话的规则,是应用层协议。

  • 应用层协议
  • 基于TCP
  • 默认是无状态的(每次请求独立,服务器不记住你)
    工作原理:客户端发起请求 -> 服务器返回响应