# 作品集


## Shane Zhang (张欣耕)
联合创始人兼首席工程师 | AI/ML 专家


## Contact Information
- 732-491-6378
- zhangxingeng970221@gmail.com
- www.shanechang.com


## Summary
<no value>


## Professional Experience

### Empath Legal - 联合创始人兼首席工程师
*2025年1月 - 至今*

Location: 新泽西州皮斯卡特维

- 架构并实施了一个基于 Pydantic AI 的高级 Agentic RAG 系统, 使用 ReACT 框架编排多个 GenAI 智能体, 以提高法律文档分析中的内容检索准确性。
- 使用 Litestar (具有比 FastAPI 更优越架构灵活性的现代 Python 框架) 设计并开发了可垂直扩展的 RESTful API 后端, 利用 WebSocket 和 SSE 实现异步响应式实时 LLM 集成。
- 实施了全面的评估框架, 以确保高质量的 AI 生成结果, 降低幻觉率并保持法律专业人员所需的可靠性。
- 集成了多个 LLM 提供商, 包括 Google Gemini (用于长上下文处理) 、Anthropic Claude (用于输出质量) 、OpenAI GPT (用于个性和推理) 以及像 Mixtral 这样的开源模型以实现成本效益。
- 使用 TypeScript、SvelteKit 和 shadcn 协作开发前端, 创建专为非技术律师设计的高度直观、用户友好的界面, 强调易用性和交互式工作流。
- 设计并维护具有适当索引策略的 PostgreSQL 数据库架构, 利用 SQLAlchemy 和 Advanced Alchemy ORM 优化高容量 AI 操作的查询性能。
- 构建了用于内部使用的专有 GenAI 框架, 以确保跨不同 LLM 提供商和用例的高质量、可预测的输出。
- 使用 Docker 对解决方案进行完全容器化以实现可扩展部署, 实施包含 GitHub Actions、SonarQube 和用于 AsyncIO 测试的 PyTest 的全面 CI/CD 管道。
- 使用 Celery 进行任务管理, 使用 Temporal Workflow 处理复杂、可靠的多步骤流程, 设计了工作流编排。
- 实施 Redis 用于发布订阅功能和缓存, 并集成 OpenSearch 用于可观测性 (指标和追踪) 以及 structlog 用于全面日志记录。
- 设计了复杂的提示词和护栏, 以确保 AI 协助用户而不引导或误导他们的意见, 保持人类判断在决策过程中的核心地位。
- 领导与非技术利益相关者的跨职能团队会议, 确保 AI 开发符合客户需求并为法律专业人员提供有意义的价值。
- 在整个代码库中强调强类型 Python, 以确保生产环境中的稳健性、可维护性和可靠性。

### 花旗集团 (Citigroup Inc.) - AI/ML 工程师
*2024年8月 - 2024年12月*

Location: 新泽西州拉瑟福德

- 使用 Python 构建结构化数据处理管道, 以实现高效的文档处理和分析。
- 使用 FastAPI 设计 RESTful API, 用于实时数据摄取和 NLP 处理到 PostgreSQL 数据库中。
- 使用 OpenShift 和 Apache Spark 大规模部署解决方案, 维护稳健的 CI/CD 程序。
- 利用 LangChain 使用 Agentic RAG 系统和知识图谱 (RDF 和 LPG 格式) 来提高 AI 驱动的合规性分析中的检索准确性。
- 实施评估指标和可视化, 以确保 LLM 质量并减少错误调查时间。
- 利用 OpenAI GPT、Claude 和 Google Gemini 模型, 并微调开源 LLM 以开发定制的 Agentic RAG 系统。
- 开发以人为本的评估框架 (RLHF), 以评估 LLM 在现实场景中的表现并确保与用户意图保持一致。
- 使用 S3、EC2、Glue、Lambda、SageMaker 和 Bedrock 在 AWS 上部署 AI 驱动的 RAG 系统, 用于数据处理和 LLM 集成。
- 开发 FastAPI 接口和 gRPC 协议, 用于 Azure 和 AWS 云提供商之间的 API 集成。

### 罗伯特伍德约翰逊大学医院 (Robert Wood Johnson University Hospital) - AI/ML 工程师
*2023年1月 - 2024年8月*

Location: 新泽西州新不伦瑞克

- 设计、构建并部署了一个使用 Python、JavaScript、SQL 和 Chroma 向量数据库的 Agentic RAG 系统, 以自动化研究文档的解析和摘要。
- 使用 OpenAI 和 React 框架设计了一个高级 RAG 系统, 以减少学术人员的入职时间并提高研究效率。
- 与学术研究人员组成的跨职能团队合作, 将反馈整合到 NLP 系统中, 使平台与研究目标保持一致。
- 为员工举办 ML 使用研讨会, 推动整个组织采用 ML 增强的工作流。
- 利用 AWS SageMaker 进行模型微调, 利用 AWS Bedrock 在生产环境中提供模型服务。

### Fiskkit Inc. - 机器学习工程师
*2020年1月 - 2021年7月*

Location: 加利福尼亚州旧金山

- 将 NLP 驱动的功能集成到 Node.js 后端, 使用 PyTorch (C++ CUDA) 进行实时文本生成和摘要。
- 使用 PySpark、NumPy 和 Pandas 进行数据预处理和探索, 以确保模型训练的高质量数据集成。
- 使用 TensorRT 通过量化和剪枝技术优化深度学习模型。
- 使用 Neo4j 和 Cypher 查询构建语义图数据库, 以存储和查询复杂关系。


## Technical Skills

### 生成式 AI & 大语言模型
- Agentic RAG 系统
- 检索增强生成 (RAG)
- LLM 微调 & 参数高效微调 (PEFT)
- 提示工程 (Prompt Engineering)
- OpenAI GPT
- Google Gemini
- Anthropic Claude
- 开源 LLM (Llama, Mixtral, Gemma, Deepseek)
- 知识图谱 (RDF & LPG)
- RLHF & 评估框架

### 机器学习 & 自然语言处理
- PyTorch
- TensorFlow
- Transformers & HuggingFace
- spaCy & NLTK
- 模型优化 (量化, 剪枝)
- 神经网络 & GANs
- Stable Diffusion

### 后端 & API
- Python (强类型)
- Litestar
- FastAPI
- Pydantic AI
- REST API & WebSocket
- gRPC
- 服务器发送事件 (SSE)
- Celery & Temporal 工作流

### 前端 & UI
- TypeScript
- SvelteKit
- shadcn
- React
- JavaScript

### 数据 & 数据库
- PostgreSQL
- pgvector
- SQLAlchemy & Advanced Alchemy
- Redis (缓存 & 发布订阅)
- Chroma
- FAISS
- Neo4j & Cypher
- Elasticsearch & OpenSearch
- PySpark & Pandas

### DevOps & 基础设施
- Docker
- GitHub Actions (CI/CD)
- PyTest (AsyncIO 测试)
- Ruff (Linting)
- SonarQube
- OpenSearch (可观测性)
- structlog
- AWS (SageMaker, Bedrock, S3, EC2, Lambda, Glue)
- Azure Cloud
- OpenShift & Kubernetes


## Education

### 计算机科学硕士, 机器学习方向 - 罗格斯大学 (Rutgers, The State University of New Jersey)
*2020年12月 - 2022年12月*

GPA: GPA: 3.71

### 计算机科学学士 - 罗格斯大学 (Rutgers, The State University of New Jersey)
*2017年9月 - 2020年9月*


## Languages
- 英语 (流利)
- 中文 (母语/流利)


## Certifications

### AWS 认证机器学习 - 专业级 (MLS-C01)
*Amazon Web Services* - 2024年6月

验证在 AWS 上构建、训练、调整和部署 ML、深度学习、生成式 AI 和 LLM 模型的专业知识


### PADI 救援潜水员
*国际专业潜水教练协会 (Professional Association of Diving Instructors)* - 2018年12月

高级水肺潜水认证, 专注于潜水员安全和应急响应。接受管理压力和恐慌潜水员的培训, 强调在生命威胁情况下保持冷静以评估情况并执行有效的救援方案。


## Teaching Experience

### 助教 - 罗格斯大学 (Rutgers University)
*2020年12月 - 2022年12月*

辅导计算机科学和机器学习的学生, 帮助将理论概念与实际实现相结合


## Additional Information

### 出版物
- Berns, M. P., Nunez, G. M., Zhang, X., et al. (2024年9月). Auditory Decision-making Deficits After Permanent Noise-induced Hearing Loss.


## Interests
- 生成式 AI
- 水肺潜水
- 阅读
- 哲学
- 心理学
- 社会学


---
Resume generated from structured data - Visit the full interactive version at: https://www.shanechang.com/zh-cn/portfolio/