# 作品集 ## Shane Zhang (张欣耕) 联合创始人兼首席工程师 | AI/ML 专家 ## 联系信息 - 732-491-6378 - zhangxingeng970221@gmail.com - www.shanechang.com ## 个人简介 ## 工作经历 ### Empath Legal - 联合创始人兼首席工程师 *2025年1月 - 至今* 地点:新泽西州皮斯卡特维 - 架构并实施了一个基于 Pydantic AI 的高级 Agentic RAG 系统,使用 ReACT 框架编排多个 GenAI 智能体,以提高法律文档分析中的内容检索准确性。 - 使用 Litestar(具有比 FastAPI 更优越架构灵活性的现代 Python 框架)设计并开发了可垂直扩展的 RESTful API 后端,利用 WebSocket 和 SSE 实现异步响应式实时 LLM 集成。 - 实施了全面的评估框架,以确保高质量的 AI 生成结果,降低幻觉率并保持法律专业人员所需的可靠性。 - 集成了多个 LLM 提供商,包括 Google Gemini(用于长上下文处理)、Anthropic Claude(用于输出质量)、OpenAI GPT(用于个性和推理)以及像 Mixtral 这样的开源模型以实现成本效益。 - 使用 TypeScript、SvelteKit 和 shadcn 协作开发前端,创建专为非技术律师设计的高度直观、用户友好的界面,强调易用性和交互式工作流。 - 设计并维护具有适当索引策略的 PostgreSQL 数据库架构,利用 SQLAlchemy 和 Advanced Alchemy ORM 优化高容量 AI 操作的查询性能。 - 构建了用于内部使用的专有 GenAI 框架,以确保跨不同 LLM 提供商和用例的高质量、可预测的输出。 - 使用 Docker 对解决方案进行完全容器化以实现可扩展部署,实施包含 GitHub Actions、SonarQube 和用于 AsyncIO 测试的 PyTest 的全面 CI/CD 管道。 - 使用 Celery 进行任务管理,使用 Temporal Workflow 处理复杂、可靠的多步骤流程,设计了工作流编排。 - 实施 Redis 用于发布订阅功能和缓存,并集成 OpenSearch 用于可观测性(指标和追踪)以及 structlog 用于全面日志记录。 - 设计了复杂的提示词和护栏,以确保 AI 协助用户而不引导或误导他们的意见,保持人类判断在决策过程中的核心地位。 - 领导与非技术利益相关者的跨职能团队会议,确保 AI 开发符合客户需求并为法律专业人员提供有意义的价值。 - 在整个代码库中强调强类型 Python,以确保生产环境中的稳健性、可维护性和可靠性。 ### 花旗集团 (Citigroup Inc.) - AI/ML 工程师 *2024年8月 - 2024年12月* 地点:新泽西州拉瑟福德 - 使用 Python 构建结构化数据处理管道,以实现高效的文档处理和分析。 - 使用 FastAPI 设计 RESTful API,用于实时数据摄取和 NLP 处理到 PostgreSQL 数据库中。 - 使用 OpenShift 和 Apache Spark 大规模部署解决方案,维护稳健的 CI/CD 程序。 - 利用 LangChain 使用 Agentic RAG 系统和知识图谱(RDF 和 LPG 格式)来提高 AI 驱动的合规性分析中的检索准确性。 - 实施评估指标和可视化,以确保 LLM 质量并减少错误调查时间。 - 利用 OpenAI GPT、Claude 和 Google Gemini 模型,并微调开源 LLM 以开发定制的 Agentic RAG 系统。 - 开发以人为本的评估框架 (RLHF),以评估 LLM 在现实场景中的表现并确保与用户意图保持一致。 - 使用 S3、EC2、Glue、Lambda、SageMaker 和 Bedrock 在 AWS 上部署 AI 驱动的 RAG 系统,用于数据处理和 LLM 集成。 - 开发 FastAPI 接口和 gRPC 协议,用于 Azure 和 AWS 云提供商之间的 API 集成。 ### 罗伯特伍德约翰逊大学医院 (Robert Wood Johnson University Hospital) - AI/ML 工程师 *2023年1月 - 2024年8月* 地点:新泽西州新不伦瑞克 - 设计、构建并部署了一个使用 Python、JavaScript、SQL 和 Chroma 向量数据库的 Agentic RAG 系统,以自动化研究文档的解析和摘要。 - 使用 OpenAI 和 React 框架设计了一个高级 RAG 系统,以减少学术人员的入职时间并提高研究效率。 - 与学术研究人员组成的跨职能团队合作,将反馈整合到 NLP 系统中,使平台与研究目标保持一致。 - 为员工举办 ML 使用研讨会,推动整个组织采用 ML 增强的工作流。 - 利用 AWS SageMaker 进行模型微调,利用 AWS Bedrock 在生产环境中提供模型服务。 ### Fiskkit Inc. - 机器学习工程师 *2020年1月 - 2021年7月* 地点:加利福尼亚州旧金山 - 将 NLP 驱动的功能集成到 Node.js 后端,使用 PyTorch (C++ CUDA) 进行实时文本生成和摘要。 - 使用 PySpark、NumPy 和 Pandas 进行数据预处理和探索,以确保模型训练的高质量数据集成。 - 使用 TensorRT 通过量化和剪枝技术优化深度学习模型。 - 使用 Neo4j 和 Cypher 查询构建语义图数据库,以存储和查询复杂关系。 ## 技能专长 ### 生成式 AI & 大语言模型 - Agentic RAG 系统 - 检索增强生成 (RAG) - LLM 微调 & 参数高效微调 (PEFT) - 提示工程 (Prompt Engineering) - OpenAI GPT - Google Gemini - Anthropic Claude - 开源 LLM (Llama, Mixtral, Gemma, Deepseek) - 知识图谱 (RDF & LPG) - RLHF & 评估框架 ### 机器学习 & 自然语言处理 - PyTorch - TensorFlow - Transformers & HuggingFace - spaCy & NLTK - 模型优化 (量化, 剪枝) - 神经网络 & GANs - Stable Diffusion ### 后端 & API - Python (强类型) - Litestar - FastAPI - Pydantic AI - REST API & WebSocket - gRPC - 服务器发送事件 (SSE) - Celery & Temporal 工作流 ### 前端 & UI - TypeScript - SvelteKit - shadcn - React - JavaScript ### 数据 & 数据库 - PostgreSQL - pgvector - SQLAlchemy & Advanced Alchemy - Redis (缓存 & 发布订阅) - Chroma - FAISS - Neo4j & Cypher - Elasticsearch & OpenSearch - PySpark & Pandas ### DevOps & 基础设施 - Docker - GitHub Actions (CI/CD) - PyTest (AsyncIO 测试) - Ruff (Linting) - SonarQube - OpenSearch (可观测性) - structlog - AWS (SageMaker, Bedrock, S3, EC2, Lambda, Glue) - Azure Cloud - OpenShift & Kubernetes ## 教育背景 ### 计算机科学硕士,机器学习方向 - 罗格斯大学 (Rutgers, The State University of New Jersey) *2020年12月 - 2022年12月* 绩点:GPA: 3.71 ### 计算机科学学士 - 罗格斯大学 (Rutgers, The State University of New Jersey) *2017年9月 - 2020年9月* ## 语言能力 - 英语(流利) - 中文(母语/流利) ## 认证证书 ### AWS 认证机器学习 - 专业级 (MLS-C01) *Amazon Web Services* - 2024年6月 验证在 AWS 上构建、训练、调整和部署 ML、深度学习、生成式 AI 和 LLM 模型的专业知识 ### PADI 救援潜水员 *国际专业潜水教练协会 (Professional Association of Diving Instructors)* - 2018年12月 高级水肺潜水认证,专注于潜水员安全和应急响应。接受管理压力和恐慌潜水员的培训,强调在生命威胁情况下保持冷静以评估情况并执行有效的救援方案。 ## 教学经历 ### 助教 - 罗格斯大学 (Rutgers University) *2020年12月 - 2022年12月* 辅导计算机科学和机器学习的学生,帮助将理论概念与实际实现相结合 ## 其他信息 ### 出版物 - Berns, M. P., Nunez, G. M., Zhang, X., et al. (2024年9月). Auditory Decision-making Deficits After Permanent Noise-induced Hearing Loss. ## 兴趣爱好 - 生成式 AI - 水肺潜水 - 阅读 - 哲学 - 心理学 - 社会学 --- 简历由结构化数据生成 - 访问完整交互版本:https://www.shanechang.com/zh-cn/%E4%BD%9C%E5%93%81%E9%9B%86/