0%

去中心化 安全

比特币以没有意义的耗时复杂运算(工作量证明PoW)竞争新区块的记账权 即挖矿过程

94年出生的维塔利克 被比特币吸引 加入到比特币交流的圈子 受其启发 提出结合图灵完备语言 实现基于区块链的基础建设 即以太坊的概念
2015年以太坊第一版。

以太坊整合智能合约平台的数字货币网络,其转换了区块链应用开发的思维模式,对底层区块链技术进行了封装,降低了区块链应用的开发难度。开发人员可以借助智能合约完成各种业务,包括但不限于金融交易、众筹、公司管理、知识产权管理等。

不可能三角: 去中心化 — 可扩展性 — 安全性

区块链不可能三角

DAO(Decentralized Autonomous Organization)去中心化自治组织

DApp(Decentralized Application)去中心化应用 包括金融 社交 游戏 NFT等

DeFi(Decentralized Finance)去中心化金融

NFT(Non-Fungible Tokens)非同质化资产

  • prompt
  • Agent
  • Function call
  • RAG(Retrieval-augmented Generation)检索增强生成
  • Fine tuning

智能体的意义:

维度 AIGC (如 ChatGPT/Claude) AI Agent (如 Manu, Operator, Devin) 意义
核心本质 语言模型 (Probability Machine) 系统 + 模型 (System + LLM) 从“单一能力”走向“综合系统”。Agent 开发本质上是软件工程架构的升级
交互模式 被动响应 (Passive)
问 -> 答 -> 结束
主动交互 (Active)
目标 -> 规划 -> 执行 -> 反馈
解决了传统大模型“只会动嘴不会动手”的问题。将 AI 的能力从信息输出转化为实际行动
工作流程 线性/无状态
一次性生成,上下文依赖 Prompt
循环/有状态
感知 -> 规划 -> 行动 -> 观察 -> 修正…
通过引入状态机记忆机制,让 AI 能够处理复杂的长周期任务,而不是仅仅处理单次对话。
能力边界 受限于训练数据和 Prompt
无法获取实时数据,无法操作外部软件
拥有工具
可以联网搜索、读写文件、操作 IDE、调用 API
打破了模型自身的物理限制。通过 Function Calling (工具调用),让 LLM 成为了操作系统的“大脑”。
自主性
用户必须精确地描述每一步指令
中/高
给定目标,Agent 自主拆解步骤并处理异常
极大降低了用户的使用门槛。用户只需说“帮我爬取这个网站并分析数据”,Agent 会自动处理中间的报错和重试。
容错性
一次回答错误通常导致结果不可用

具备 Self-Reflection (自我反思) 能力,发现错误会自动重试
引入了试错机制。Agent 开发的核心难点和价值之一,就是如何让 AI 学会“检查自己的作业”并修正。
交互场景 受限于文本、翻译、代码补全、问答 自动化办公、复杂流程操作、自主编程、私人助理 将 AI 从“辅助工具”变成了“虚拟员工”,能够替代人类完成重复性、流程化的数字化工作。

总结:

AI agent 的核心价值在于其三个核心能力: 动态任务路由、生态化工具集、全周期记忆管理

langchain

RAG

embedding工具将文本分割 提炼语义生成向量索引 对llm的提问也是一个‘向量’, 通过向量之间的‘距离’匹配符合提问的知识点,llm提取对应文本并组织成回答

本质是 用既有资料文本 补充上下文

AI 应用开发

岗位职责

  1. 负责AI应用(含大模型/LLM)前后端开发,涵盖模型集成、用户界面设计等
  2. 设计、开发和维护AI智能Agent系统,包含RAG、Prompt、记忆/规划模块等
  3. 大模型应用落地,涉及智能客服、知识库问答、专业报告生成等场景
  4. 模型相关优化,包括Prompt工程、性能调优、推理加速及微调方案设计
  5. 开发模型服务API接口,实现与其他系统或应用的对接调用
  6. 参与项目需求分析、技术方案设计及跨团队(产品、数据科学家等)协作
  7. 负责数据处理相关工作,包括数据采集、清洗、标注、特征工程等

任职要求

  1. 编程能力:熟练掌握至少一种后端编程语言(Python/Java/Go等)及对应开发框架
  2. 前端技能:熟悉前端技术栈(React/Vue/HTML/CSS等),具备全栈开发能力者优先
  3. AI知识:了解大模型(LLM)基本原理,有AI Agent、RAG相关开发经验
  4. 框架使用:熟悉主流AI开发框架(LangChain/LangGraph/Dify等)的使用
  5. 数据库经验:具备关系型(MySQL/PostgreSQL)及NoSQL(MongoDB/Redis)数据库应用经验
  6. 向量数据库:掌握向量数据库原理及使用方法,有知识库构建经验
  7. 云服务与容器:熟悉云服务平台(AWS/阿里云等)及容器化技术(Docker/K8s)
  8. 项目经验:有完整AI应用项目开发经验,具备0-1项目落地能力者优先

二、面试考察点

1. 项目细节与实战能力

  • 详细询问简历中提到的项目细节和技术方案
  • 提出实际业务场景问题,考察解决实际问题的能力
  • 评估RAG流程实现细节:使用的知识库类型、解决的具体问题等
  • 考察模型微调、部署和优化的实际经验

2. 技术原理深度

  • Transformer架构及大模型发展脉络
  • 多模态模型相关知识
  • 强化学习(特别是用于智能体优化的场景)
  • 模型微调、量化、蒸馏等技术原理
  • 智能路由(意图决策)机制的理解

3. 工程实践能力

  • 模型服务部署和性能优化经验
  • 高并发推理服务设计能力
  • 向量检索/RAG增强大模型的实现经验
  • 知识图谱在特定场景(如金融、医疗)的应用

4. 基础知识

  • 数据结构与算法
  • 编程能力与代码质量
  • 系统设计能力

5. 业务理解与落地能力

  • 如何将AI技术与传统业务结合
  • 模型评估方法与指标
  • 持续迭代优化的思路和方法
  • 对AI技术边界的认识

SillyTavern Github

SillyTavern 是一个基于node.js的前端界面(GUI)。它本身不具备思考能力,但它可以连接各种强大的大语言模型(LLM)API.
核心逻辑:用户输入 + 角色设定卡 + 世界书(Lorebook) —> SillyTavern 封装成 Prompt —> 大模型回复。

安装

1
2
3
git clone https://github.com/SillyTavern/SillyTavern
cd SillyTavern
Start.bat

ST interface

推荐模型

  • Gemini
  • Claud
  • 哈基米
  • Deepseek

clewd

clewd 是一个开源的,将Claude 模型(网页端/官网版本)“桥接”到 SillyTavern 等前端软件的代理工具。

世界书和角色卡

世界书(Lorebook)包含一些专有名称的解释 语态的前提

Discord类脑 https://discord.gg/ftFV2TCKEx

预设/破限:可以导入文件,其中有规范的指令指导AI回复(预设)和防止AI道歉(破限),预设为主体,破限通常为指令中的一部分,可能单独可能与预设混合也可能没有。因此两种称呼时有混用

导入破限/预设通常会附带正则,还可能包括快速回复(QR)或者其它文件,需要按作者说明操作。不同预设因为作者编写时的语句、用词、倾向等等,AI呈现的风格不尽相同,可以多多尝试比较选择自己喜欢的。

用 RAG 搭建一个 AI 小说问答系统

LLMWriter

索隐派 - 蔡元培 悼明隐喻
考据派 - 曹雪芹身世 家族没落回忆

湖心亭看雪

崇祯五年十二月,余在西湖。大雪三日,湖中人鸟声俱绝。是日更(gēng)定矣,余挐(ráo)一小船,拥毳(cuì)衣炉火,独往湖心亭看雪。雾凇沆砀(hàngdàng),天与云与山与水,上下一白。湖上影子,惟长堤一痕,湖心亭一点,与余舟一芥,舟中人两三粒而已。
  
到亭上,有两人铺毡对坐,一童子烧酒炉正沸。见余,大喜曰:“湖中焉得更有此人!”拉余同饮。余强饮三大白而别,问其姓氏,是金陵人,客此。及下船,舟子喃喃曰:“莫说相公痴,更有痴似相公者!”

  • 湖中焉得更有此人: 想不到在湖中还能遇见你这样有(闲情雅致)的人 更有:还有,末尾句中同义

选自《陶庵梦忆》张岱,明亡后不仕,入山著书以终。著有《陶庵梦忆》等名著。此文是多年后的回忆,崇祯五年,受小冰河周期影响,西湖大雪,北方严寒天灾,多地农民起事。

自崇祯二年,皇太极率军入关,京畿震动,史称己巳之变。彼时明王朝内忧外患,风雨飘摇,文字所叙的静谧幽雅背后,历史的车轮正滚滚向前,湖心亭看雪时未必全然是闲情雅致,更何况明亡之后,在山中写下此文之时。可见,写雪便不再是写风景,而是回首故国的悲凉的凝望。

问其姓氏,是金陵人,看似答非所问,了解上述背景后就可想而知了

销售成品软件 或基于成品的二次开发,而不是从头开发定制需求

开发工具软件 包装成产品

  • Headless CMS:Strapi
  • 前台:Next.js TailWindCss
  • 后台:Ant Design Pro, Refine, Vben Admin
  • 数据库:PostgreSQL MongoDB
  • 电商:Medusa (Node.js/Express/React/PostgreSQL) Stripe
  • 移动端:Taro

  • 项目模板:MvpFast

  • 设计:LogoCook
  • 自律:WeFight
  • 用户反馈:IMessageU
  • 二维码:CodeBox

争议 turborepo tanstack

设计Agent:

V0.app
Stitch

配色设计: colors.co

minerU 文本图像转文字

LaTeX 文档排版(包括公式)

3d-force-graph

Quick start

1
import ForceGraph3D from '3d-force-graph';

or using a script tag

1
<script src="//cdn.jsdelivr.net/npm/3d-force-graph"></script>

then

1
2
const myGraph = new ForceGraph3D(<myDOMElement>)
.graphData(<myData>);

Input JSON syntax

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
{
"nodes": [
{
"id": "id1",
"name": "name1",
"val": 1
},
{
"id": "id2",
"name": "name2",
"val": 10
},
...
],
"links": [
{
"source": "id1",
"target": "id2"
},
...
]
}

Examples

基因组相关概念

  • 基因组、比较基因组、同源性
  • BLAST原理 Synteny
  • 重测序
  • 群体遗传
  • 单倍型定相

分析图表

  • 家族分析:HMMER、Phylogeny进化树、保守基序分析
  • 真菌基因组 BSA性状定位分析
  • 遗传图谱构建及QTL定位

基因组测序

基因测序从抢发 一物种已发表 到 基因密度升级

草图 —> 高质量图谱

N50长度指标(序列中位数所在基因片段的长度) 如scaffold N50 5.558M

初代测序技术、光学图谱技术 —> Hi-C技术(2019) 更少的gaps

比较基因组分析 基因家族收缩/扩张 pan-genomes(对几个到几千个代表性个体测序 构建代表整个物种的基因序列集合)

“全基因组复制”

GPT: 全基因组复制,你可以把它想象成一次彻底的“代码库备份”。简单来说,就是在生物进化的某个时刻,一个生物体内的整套基因组,不是单个基因,而是全部DNA,被完整地复制了一份。这个生物就突然从“二倍体”变成了“四倍体”(甚至更高倍性)。

重复序列的命运:A失活 非对称丢失;B基因剂量保留 表型增强;C积累突变新功能化;D 分化亚功能化

基因家族 某个祖先基经复制、在漫长进化历程中演化形成的序列相似、功能常常有相关的基因

NBS Nucleotide-Binding Site,也就是核苷酸结合位点 可以把它理解成一个基因编码的蛋白质上的一个“分子开关”或“能量引擎”。含有NBS结构域的基因,本身就构成了一个庞大而重要的基因家族——NBS-LRR基因家族。这个家族是植物免疫系统的核心