去远方

发表于2026-06-06|agent

运行架构使用标准的ReAct循环，不断追加工具结果。工具调用使用MCP协议每个工具有一个处理函数。路径沙箱防止逃逸工作区。 dispatch map 将工具名映射到处理函数。循环中按名称查找处理函数。循环体本身与 s01 完全一致。加工具 = 加 handler + 加 schema。循环永远不变。 tool schema 是给模型看的说明 handler map 是代码里的分发入口 tool_result 是结果回流到主循环的统一出口任务进行时会写出一个待办清单，并且查看和修改清单也会作为工具 { "content": "Read the failing test", "status": "pending" | "in_progress" | "completed", "activeForm": "Reading the failing...

agent方向调研

发表于2026-01-21|agent

前言毕设进度基本上差不多了，接下来就是先探索一下接下来的研究领域力！在完成毕设的过程中涉猎了下agent开发的相关领域，在兴趣上还是挺契合的，前些天看了下一些相关进展，但是没有动笔记录下来，还是会浅浅略过，过一眼就忘，还是得在阅读过程中顺带记录一下，并且时间上也不是特别连续，下一次就忘了这一次干了什么事情了…… 话不多说，开始笔记。 Gemini的调研核心科研趋势一：自进化智能体（Self-Evolving Agents）的范式确立核心科研趋势二：通信协议的标准化与“智能体互联网” 2025 年的协议综述提出了一套系统的分类标准，将现有协议分为面向上下文（Context-Oriented）与智能体间（Inter-Agent）两个维度，并区分为通用型与领域特定型协议名称开发者/机构分类维度核心创新点与技术路径 Model Context Protocol...

duckdb初探

发表于2025-10-30|OLAP

前言依旧先创个帖子激励自己…… 贴一下用于vscode调试看代码的配置信息： tasks.json { "version": "2.0.0", "tasks": [ { "label": "build DuckDB debug", "type": "shell", "command": "make", "args": ["debug"], "group": { "kind": "build", "isDefault": true ...

[论文阅读]G-OLAP

发表于2025-10-29|数据库

数据直接从ssd传输进gpu，不过IO依然是由cpu启动的，控制流由cpu线程处理。通过重叠 I/O与解压缩这两种操作达到效率提升。(gpu的流操作：在实际的 I/O 大小下，SSD 需要多个并发 I/O 才能使可用 I/O 带宽饱和。使用 GDS 的一个重要方面是，并发 I/O 只能通过多个 CPU 线程发出同步（阻塞）GDS 读取或写入来实现，或者最近，通过将对异步 GDS 原语的 I/O 调用放入不同的 CUDA 流中来实现。) 数据压缩与剪枝，修剪的操作，总体来说应该就是列存，可以绕过每次取元数据都需要取行存时无关过滤的其他列的问题。修剪是为了充分利用gpu，还没开始数据加载前就可以针对于并行块进行修剪检查。为什么使用列存？gpu的访问形式很固定，使用列存可以更充分使用gpu的存储体结构，它更适合gpu的并行计算特性比方一个cuda程序： threadidx = block.dim*block.y+block.xif(col_meta[threadidx].value > 50) return...

CUDA编程

发表于2025-10-13|数据库

前言CUDA快速入手系列视频谭升博客我的代码内容大概是对视频、博客的一个个人学习总结以及部分高质量内容的摘抄汇总，以及补充自己的一些个人理解。入门下cuda编程，GPU感觉是一个必须要会的东西 CPU适合执行复杂的逻辑，比如多分支，其核心比较重（复杂） GPU适合执行简单的逻辑，大量的数据计算，其吞吐量更高，但是核心比较轻（结构简单） GPU主要负责并行计算...

[论文阅读]GPU-accelerated Database Systems Survey and Open Challenges

发表于2025-10-04|数据库

GPU与CPU显卡通过 PCIExpress 总线连接到主机系统总线带宽低（比主机内存慢2-3倍），所以数据传输是瓶颈。GPU有多个多处理器，每个多处理器里有成百上千个简单核心，适合并行计算，但不适合复杂控制逻辑（比如分支太多会慢）。编程模式：编程GPU用“内核模型”：主机代码管理GPU，内核是并行单元，一堆线程（thread）同时跑同一个代码。常用框架是CUDA（NVIDIA专用，有高级功能如统一虚拟地址UVA，让CPU/GPU透明共享内存）和OpenCL（跨厂商，但功能少点）。内核以 SIMD 方式在多个标量处理器上同时调度。性能瓶颈：GPU 编程中最重要的性能因素之一是避免主机和设备之间的数据传输：所有数据都必须通过 PCIexpress 总线传递，这是架构的瓶颈。（访问主内存的速度大约是通过 PCIexpress 总线发送数据的两到三倍) GPU是专用处理器，大约来说只能应对于特定任务，GPU 上的连接速度要快 2-7 倍，而由于需要数据传输，选择速度要慢 2-4 倍（He and others observed that joins are 2–7...

完赛！双国一！

发表于2025-08-24|数据库

好好好，拿下计算机系统能力大赛数据库管理系统设计赛和智能系统创新赛双国一，主要还是因为这两时间重合在一起了，最后都能拿下国一还是蛮幸运的，只能说感谢队友，数据库回来后4天速通小米杯，全对！

rmdb代码解读

发表于2025-07-20|数据库

引言初赛因为太早完成了，后面有很长一段时间没有再看过代码，并且既然决赛有了线下赛的新要求，那就还是简单的就代码做一个回顾吧。总体而言，架构与miniob也还是比较相像，架构图如下：遵循的还是语法解析->构造算子树->执行器运行算子...

cyber小鲸——基于mediapipe、大模型融合的数字人

发表于2025-06-02

...

mvcc的初步学习

发表于2025-06-01|数据库

前言这几天正在打rmdb这个比赛，初赛还在进行中，虽然在开赛第一周的时候就已经基本上完成了所有题目了，但是还是有些比较困难的知识点没搞懂，而且像mvcc这种题目，非常玄乎，队友把他搞出来了，但自己却是一知半解，刚好15445-2024fall有这个的专门讲解，那就稍微看看做下笔记，以及后续再跟着代码再看一遍…… 成绩镇帖（2025-5-26 16:12）：初步概念学习先感慨一句，这玩意做成分布式的不炸了吗…… 线性流程大概如下：事务t1和t2分别begin 并且同时修改一个元组A t1先修改为A1 修改的时候分配一个开始时间戳给A1 他们的结束时间戳全部设为无穷(表示未结束或下一版本未结束修改本事务) 当t1在t2之前commit，当t2结束事务后，就会把比他先结束的A1的结束时间戳设置为他的开始时间戳，这样的话时间戳顺序就是A1 (0 - 2) A2 (2 - 无穷) 有一个新事务t3来的话他的开始时间戳就是3 A1对他就是不可见的他必须找到一个包含他事务号的区间的事务才对他是可见的也就是2 - 无穷，这个时候还不能确定可见的事务是否已提交...