blueyi's notes

Follow Excellence,Success will chase you!

本文从底层约束出发,系统整理日常对话中的 Prompt 设计、完整 Agent 维度模型(说明为何仅有 Soul / Memory / Skill 仍不足)、多 Agent 编排编码 Agent 的实战技巧,并补充知识库与文档组织的通用原则。适用于产品、研发与个人使用者,不绑定某一款 IDE 或编排框架。

English abstract: A systematic playbook for LLM and agent use: why techniques work under limited context, prompt design by depth, a ten-dimension agent model (beyond persona/memory/skills), multi-agent orchestration patterns and contracts, coding-agent practices, and documentation layout tradeoffs—framework-agnostic.

Read more »

Triton Language Extension (TLE)、FlagTree 编译器与 AscendNPU-IR 构建了从算子编程到硬件执行的端到端技术融合体系:

  • TLE:通过编译提示(Hints)机制扩展 Triton 语言,传递硬件优化意图
  • FlagTree:统一编译框架,解析 Hints 并驱动 MLIR 优化 Pass,实现 TTIR → Linalg IR 转换
  • AscendNPU-IR:分层开放中间表示,承接 Linalg IR,在 HFusion/HIVM 层完成昇腾硬件深度优化

核心成果:关键算子性能提升 10%~20%,为 AI 开发者提供”编写一次、多端高效运行”的统一编程体验。

Read more »

一份面向AI 基础设施全栈知识体系学习指南,涵盖从算力、数据、训练、推理到 MLOps/LLMOps、RAG 与可观测性的完整技术栈,并融入当前主流实践与最新技术趋势。

Read more »

本文系统梳理:大模型在日常生活、工作与工程中的可应用能力(其中开发与代码工程为最重要的一环)、常用大模型应用平台(含官网/APP、能力、免费与收费、推荐等级)、高质量 Prompt 写法,以及提升大模型应用能力的规划与学习资料。参考资料均来自官方网站或专业机构。

Read more »

docker run应该是我们日常使用docker中最常用,也最重要的命令。
命令格式如下:

1
docker run [OPTIONS] IMAGE [COMMAND] [ARG...]
Read more »

由于种种原因我们可能无法正常连接到python的官方pip源,或者连接速度很慢,或者由于根证书的原因在安装包时会提示连接证书问题,可以通过修改pip的配置来修改为国内其他源,并信任相应的源,避免证书错误,提高包安装速度。

Read more »

记录Dockerfile的编写规则和用法

Dockerfile就是用于构建image的一系列命令和参数构成的脚本,通过docker build -t <image_name:tag> -f </path/to/Dockerfile> .来构建。

docker build命令从名为Dockerfile的文件和context来构建image,context是PATH(本地目录)或者URL(Git repository位置)处的文件。context会以递归方式处理,所以PATH的子目录和git的submodules都会处理,同样这里要小心用于作为PATH的目录最好不要有与镜像无关的文件,通常会新建一个空文件夹做为context的PATH。

PATH下的.dockerignore可以用于排除文件和目录。

构建工作由Docker守护进程运行,而不是docker的CLI,其中-t参数用于指定镜像的repository和tag,可以有多个-t-f指定Dockerfile的路径,最后的.表示上下文件环境为当前目录。

例如:

1
docker build -t blueyi/python-3.6:dev -f ~/docker/Dockerfile .
Read more »

在一个系统较老的centos(6.9)上编译安装gcc4.8.5,系统源里面带的是4.7.2,对C++11中的特性支持不完整,所以需要手动编译一份新版本。
以为会很简单,直接下载源码,根据readme配置相关依赖源码,然而最后还是编译的时候报错,所以记录下来。

Read more »

默认的GCC编译选项会编译出与系统一致的输出,例如64位直接使用gcc或g++编译出的为64位程序或库,而32位系统编译的是对应32位的。
可以通过在编译时添加选项-m32-m64来指定编译生成的相应版本,如果同时带上这2个选项,只有后一个会生效。
问题的关键时多数时候会提示缺少库,这里以64位下编译32位程序为例,给出ubuntu和centos下相关依赖包。

Read more »

当安装了VS之后再安装CUDA套件就可以通过VS创建基于CUDA的项目,但往往我们会需要让之前的老项目支持对CUDA的编译,以便使用CUDA对原有项目中的部分算法加速,网上有各种各样的尝试,搜索SOF之后找到一个超简单的方法,记录之。

Read more »
0%