Honesty的个人记录博客，记录生活中的趣事 分享一些个人技术观点, HeHouHui,HeHui,明厚,HeHouHui博客,HeHouHui网站,HeHouHui Java



Harness + LLM Wiki + Spec 智能体驱动工作流（工程规范手册 + Onboarding 测试版）

优化Netlify,Vercel国内访问速度：基于 enhanced-FaaS-in-China 的多路加速

 2025火山引擎FORCE大会·冬 三大核心技术：AI原生时代的底层逻辑与实践路径

Caffeine AsyncCache：响应式架构下（WebFlux, R2DBC, ReactiveRedis）的缓存实践

事件驱动：WebFlux、R2DBC，Lettuce Reactive Redis与虚拟线程下的高性能Web项目构建指南

"关于我"页面创作之旅

高维向量检索 Faiss vector database：向量数据库的基石与核心角色 —— 解析 PQ/IVF/HNSW 算法原理、CPU/GPU 底层实现、量化误差模型及动态索引机制，详解其在 RAG / 推荐系统中的价值与工业应用

Faiss vector database 深度学习指南：从背景到架构&算法&安装  —— 向量检索核心算法（IVF-PQ/HNSW）解析、CPU/GPU 加速优化、索引构建与持久化、动态数据处理方案

今天不想做英雄，只想把碗洗干净。

LLM Context Engineering 大模型上下文工程：系统性学习核心原理与实现架构

小白入门LLM Context上下文工程：从基础到实践，通俗易懂讲明白

从 RAG 到 Context Engineering：大语言模型时代的上下文治理革命

从RAG到Context Engineering：重新定义AI系统的认知能力边界

什么是增量静态再生(ISR)技术？：从Next.js & Nuxt 开始入门

从Java到Next.js：5年博客建站的“省心省钱”之路

了解编程语言的编译器：从 CPU 指令到云原生，一次搞懂编译、字节码、JIT/AOT 的底层逻辑

MySQL InnoDB存储引擎深度解析：架构、原理与实践

MySQL InnoDB核心原理与实践：从索引到分库分表的决策速记

MySQL优化器(5)调试工具与面试指南：从“猜优化器”到“懂优化器”

MySQL优化器(4)成本模型解剖：优化器的“成本”到底怎么计算的？

MySQL优化器(3)超图优化器解析：MySQL优化器的“智能大脑”进化

MySQL优化器(2)官方文档深读笔记：优化器的“操作手册”全解析

MySQL优化器(1)编年史：从 “规则执行者” 到 “成本决策者” 的演化之路 读懂进化，掌控性能

从注解到SPI：Spring Boot配置体系的设计艺术

聊聊一个优雅组件配置设计该长啥样：从SpringBoot @Configuration到开闭原则，一次说透！

Spring Boot Cache 解刨：@Cacheable 注解用法 + Redis 缓存优化，从架构设计到批量缓存性能提升指南

MySQL行值表达式：从“一脸懵”到“玩明白”的实战指南; Mysql RVC,Mysql元组比较,Row Value Constructor/Comparison

🌱一篇总结速通 Spring Bean 生命周期：从“出生”到“入土”的 超爽攻略 📖

JDK 8至24浮点数转换底层原理与优化演进

浮点数转换IEEE 754标准：从性能损耗原理到高并发场景的优化实践

Gemini CLI 详细指南：不止命令行，更是你的AI智能体搭子 🤖✨

给 AI 装上 "记忆大脑"：Spring AI RAG 实战开源代码 —— 从 0 到 1 构建智能问答系统

特征向量入门：从线性变化到数据密码

压缩算法全家桶：Gzip/Brotli/Zstd/Deflate 从依赖安装到场景落地（Node.js & Java 实战指南）

Java端Zstd实战：序列化与反序列化全流程处理

分布式场景下限流算法的挑战与Resilience4j深度剖析

深入剖析限流：从基础概念到算法实现

Guava 组件中的四种限流算法解析

响应式开发之WebFlux & Reactor：异步非阻塞编程实践指南

向量数据库全攻略：从算法公式到选型指南，一篇吃透高维数据存储术

CompletableFuture 从源码到实战：让异步编程像喝奶茶一样丝滑

CompletableFuture 全景深度解析与高性能实践手册：从源码到业务落地

Java 四种引用类型详解：强 / 软 / 弱 / 虚引用在 JVM 垃圾回收中的处理流程与应用

 JetBrains Annotations：从入门到落地，彻底告别 NullPointerException

 Java 注解规范模板

从规范到架构：一篇读懂 Java 工程建模、分层、命名与演进之路

博客突发崩溃？我的紧急排查与解决全记录

友链这回事，总该有点温度

Spring Cache 扩展：Redis 批量操作优化方案与 BatchCache 自定义实现

🌟 探索 Moments 极简朋友圈： iPhone 16 Pro 模拟的深度优化

Spring AI RAG 高级检索增强：探索基于查询转换与文档处理的技术

Spring AI RAG 检索增强实战：MultiQueryExpander+RewriteQueryTransformer+CompressionQueryTransformer打造高精准多轮对话知识库问答系统

Spring AI 高级RAG检索增强生成优化指南： MultiQuery ，CompressionQueryTransformer，ConcatenationDocumentJoiner与文档处理提升检索精度与召回率

复杂业务场景下利用Spring Bean机制的设计与实践

Spring Bean 源码深度剖析：生命周期、加载机制与作用域的底层实现

深入排查:@Scope("prototype")与@RequestScope字段篡改问题全链路分析

Spring 作用域冲突深度解析：@Scope("prototype")与@RequestScope的冲突与解决方案

Java 线程池与多线程并发编程实战全解析：从异步任务调度到设计模式落地，200 + 核心技巧、避坑指南与业务场景结合

Netty源码深度解析：从启动到数据流转的全链路剖析

MySQL 底层技术深度解析：索引、事务、锁与优化全链路剖析

项目分层模块设计指南：让代码告别"一锅粥"，团队协作更丝滑

WebFlux 实战指南 ：从入门到精通，环境搭建、控制器设计、数据库交互（含 R2DBC）到高并发优化（限流、缓存）的响应式编程全链路实践

当我的代码评审开始 “AI 打工”：聊聊这个让我摸鱼更心安的神器

云效Flow 自定义AI代码审核步骤

Java 多线程全文深度剖析

Spring Boot加载与Bean处理的细节剖析

Spring Boot项目启动优化

Spring AI 中的 DocumentTransformer 与 RAG 深度解析

Spring AI 架构解析与核心模块实践

流程条件表达式技术方案

一个超实用的Java集合处理库——collection-complete

Java IO — NIO Channel

Java IO — NIO Buffer

Java IO — IO/NIO模型

Elasticsearch — 索引（Mapping Index）

Elasticsearch — 如何存储数据并保持一致性？

Java算法 — 快速排序（Quick Sort）

Java算法 — 比较排序（Comparison-based Sorting）

Netty — API网关Demo

Netty流程剖析 — 服务启动源码

Netty核心组件源码剖析 — ByteBuffer

Netty核心组件源码剖析 — Channel

Netty核心组件源码剖析 — NioEventLoop

网络编程 — Reactor模型与Netty

网络编程 — Socket编程与IO模型

网络基础 — 深入理解TCP协议

网络基础 — 网络模型与网络协议

JVM GC篇 — 垃圾收集器（下）

JVM GC篇 — 垃圾收集器（上）

JVM GC篇 — 一般原理与垃圾收集算法

JVM基础 — 内存结构与内存模型

JVM 基础 — 类加载机制和对象内存布局

JVM 基础 — Java 方法调用、反射调用与异常

JVM 基础 — Java 字节码

Java异步编程方式介绍

Spring Boot 实现多租户架构：支持应用多租户部署和管理

微服务之间的数据依赖问题，该如何解决？

Redis 热key是什么问题，如何导致的？有什么解决方案？

HttpClient? RestTemplate？WebClient? 不~是 RestClient

Hutool 5.8.8  BeanUtil.copyProperties 致命异常

学习思考

技术分享

碎片杂文

创作分享

首页

文章

友链

关于我

瞬间

开往

归档

Github

留言

隐私权政策

大模型真的会思考吗？为什么AutoGPT总是陷入死循环？本文深度解剖大模型的六大物理缺陷，并全景展示一套名为 Java Harness Agent 的机器对机器（M2M）操作系统，看它如何通过认知刹车、生命周期门控和多角色矩阵，将“失控的概率引擎”驯化为零返工的超级工程师。

Agent

架构设计



给大模型穿上“拘束衣”：从物理缺陷到 Agentic OS 的工程化实践

Harness Agent 后端Agent驱动研发流程，核心依托OpenSpec契约先行理念、Harness生命周期状态机、LLM Wiki知识图谱、技能矩阵（25+专业技能）、脚本工具等核心组件，构建完整研发闭环。OpenSpec冻结需求与设计基准，Harness管控研发全阶段流转，LLM Wiki实现知识沉淀与检索，技能矩阵提供专业规范支撑，脚本工具强化确定性校验，全方位解决后端研发规范不统一、知识碎片化等问题，适配各类Java后端研发场景，助力团队高效落地生产级代码。

Java

enhanced-FaaS-in-China 是一款开源工具，专为解决 Cloudflare、Vercel、Netlify 等海外 FaaS 平台部署的网页在国内访问慢、稳定性差、多省份访问失败等问题设计，仅需修改域名 CNAME 解析记录，即可实现国内三网访问速度与稳定性双重提升；筛选平均响应≤1 秒、最长≤2 秒、非 200 状态码省份≤2 个的优质 IP，对比官方 CNAME，解决多省份访问失败、个别地区时延过高问题

建站

工具

2025 火山引擎 FORCE 冬会核心技术聚焦 “从算力竞赛到效率革命” 的范式转移，通过豆包 1.8 大模型、Seed-Thinking-v1.5 推理引擎与 UltraMem 超稀疏架构的全栈协同，破解了 AI 原生时代 “性能、成本、时延” 不可能三角。核心技术涵盖：豆包 1.8 的动态计算分配（SID）与多模态时空注意力重构，实现任务适配的资源高效调度；Seed-Thinking-v1.5 的过程奖励模型（PRM）与 BeyondAIME 反污染数据集，提升复杂推理精度；UltraMem 的 TDQKR 张量分解与 IVE 隐式参数扩展，突破大模型显存与部署瓶颈。相关成果发表于 ICLR 2025 等顶会，支持国产算力昇腾适配与企业私有化知识注入，实测实现 AI 推理成本每 12 个月下降 90%。典型落地案例包括奔驰智能座舱离线交互优化，为金融、零售等行业提供低成本、高性能的 AI 原生解决方案。

大模型

在响应式编程愈发流行的今天，缓存作为提升系统性能的核心组件，其设计是否适配响应式架构直接决定了系统的吞吐量和响应性。传统的同步缓存（如Guava LoadingCache）在WebFlux等响应式框架中易引发线程阻塞、背压失控等问题，而Caffeine作为新一代高性能缓存框架，其AsyncCache组件专为异步/响应式场景设计，成为响应式架构下缓存层的首选。
本文将从Caffeine AsyncCache的核心配置入手，结合实际业务场景，深度讲解其与WebFlux、R2DBC、ReactiveRedis的整合实践，并梳理开发过程中必须规避的核心坑点；同时新增底层源码解析、架构设计原理、核心设计思想及算法公式等深度内容，补充复杂场景处理方案，通过时序图清晰呈现缓存流转逻辑，为响应式架构下的缓存设计提供完整解决方案。

WebFlux

响应式

缓存

深度整合Spring WebFlux、R2DBC、Lettuce Reactive Redis与Java虚拟线程，构建端到端非阻塞高性能Web应用。揭示90%开发者会踩的线程调度混乱、阻塞调用、副作用游离等反范式陷阱，提供BlockHound检测工具与实战口诀。详解关键/非关键副作用、分布式事务等4大生产级最佳实践场景，融合虚拟线程简化遗留代码集成。遵循本文规范，可规避常见陷阱，打造高伸缩、低延迟的现代化响应式系统，驾驭海量并发洪流。

Spring

这篇文章记录了我如何从一个简单的想法，通过100多次Git提交，逐步打造出现在的"关于我"页面。涵盖设计思路里的便当盒布局与玻璃态美学、技术实现中的3D技术球坑点、和API的拉锯战，以及最终因PWA影响核心功能而忍痛放弃的纠结过程。这是一场充满像素级纠结、bug大战与创作快感的真实开发故事。

《Faiss vector database：高维向量检索的学术基石与向量数据库中的核心角色》基于 20 篇权威文献，深度解析 Faiss 、PQ/IVF/HNSW 核心算法、CPU/GPU 硬件加速及向量数据库中的索引内核角色，为高维检索研究与落地提供学术支撑（关键词：Faiss、高维向量检索、PQ/IVF/HNSW、向量数据库、学术解析）

算法

向量数据库

《Faiss vector database 深度学习指南》聚焦向量检索工具 Faiss，拆解其核心原理、IVF-PQ/HNSW 等索引算法，详解 CPU/GPU 硬件加速、索引持久化与动态数据处理，Faiss安装，提供 RAG / 推荐系统实战方案及性能调优技巧，助力高维向量检索落地（关键词：Faiss、向量检索、GPU 加速、RAG、工业级调优）

下班后，雨停的上海街头映着霓虹，我穿过南京西路的人潮，拐进愚园路，在全家买一瓶乌龙茶，回到家。厨房灯亮起，炖番茄牛腩、泡妈妈晒的干菊花，和猫一起把日子煮成一碗热汤。电脑打开又合上，唯一的胜利是把碗洗干净

思考

本文全面解析大型语言模型（LLM）上下文工程的核心体系，指出 LLM 性能关键已从 “参数竞赛” 转向 “上下文质量”。文中先明确上下文工程的定义与数学形式化表达，对比其与传统提示工程的本质差异；再拆解三大基础组件（检索生成、上下文处理、记忆管理）的技术细节；随后详解四大系统架构（RAG、内存管理、工具集成推理、多智能体协作）的落地逻辑；最后分析核心不对称性、评估困境等技术挑战，并展望未来突破方向，为 AI开发学习者提供从理论到实践的完整指南。

本文通俗解读 LLM 上下文工程， LLM 性能不只靠参数，更依赖上下文。文中拆解核心概念（指令、外部知识、记忆等上下文 “零件” 及组装逻辑）、关键技术（用于查资料的 RAG、辅助推理的思维链、记忆管理），以及新手可搭建的可落地系统（简易 RAG、长会话记忆工具）。还分享常见问题及 3 个月学习路径，无需复杂代码，助力新手用 LangChain/FAISS 等工具让 LLM 更精准实用

Context Engineering（上下文工程）、LLM（大语言模型）、RAG（检索增强生成）分层记忆（短期 / 中期 / 长期记忆）、上下文治理（压缩 / 路由 / 窗口预算 / 评分）
• LLM 多轮对话失忆解决方法（
• RAG 的七宗罪（检索噪声 / 窗口爆炸）优化方案
• Context Engineering （分层 / 压缩 / 路由）
• LLM 上下文窗口预算算法设计
• Context Engineering 与 RAG 协同
• 降低 LLM 使用成本（Context 压缩 / 缓存机制）
• Context Engineering 常见误区（记忆混淆 / 安全缺失）