# 关于我 ## 张欣耕 (Shane Zhang) AI/ML工程师,LLM专家,RAG专家 ## 联系信息 - 732-491-6378 - zhangxingeng970221@gmail.com - www.shanezhang.com ## 个人简介 ## 工作经历 ### 花旗集团美国公司 - AI/ML工程师 *2024年8月 - 至今* 地点:新泽西州拉瑟福德 - 使用Python构建了快速的结构化数据处理管道,将每份文档的处理时间从10秒减少到1秒以内,文档处理效率提高了90%。 - 使用Python FastAPI设计和加速了一个强大的RESTful API,用于实时数据摄取和NLP处理到Postgres SQL数据库,支持每天超过100万次API调用。 - 使用OpenShift和Apache Spark部署了规模化解决方案,在120天内实现了零停机的CI/CD流程。 - 利用Python和LangChain构建了高级代理式RAG系统和知识图谱(RDF和LPG格式),提高了全球检索的准确性,将AI驱动的合规分析的F1分数从0.32提高到0.71。 - 使用LangChain和RAGAS实现了评估指标和可视化,确保LLM质量,将幻觉率降低了30%,错误调查时间减少了60%。 - 使用OpenAI GPT、Claude和Google Gemini模型,并微调开源LLM模型,开发了定制化和可扩展的代理式RAG系统,每天处理超过20万次API调用。 - 开发了以人为中心的评估框架(RLHF),用于评估LLM在现实场景中的表现,持续确保与2000多名活跃用户的意图保持一致。 - 在AWS上部署了可扩展的AI驱动RAG系统,使用S3、EC2、Glue、Lambda、SageMaker和Bedrock进行高效的数据处理和LLM集成管道。 - 开发并部署了FastAPI接口和gRPC协议,用于在Azure和AWS等云提供商之间进行高效的API集成。 ### 罗伯特·伍德·约翰逊大学医院 - AI/ML工程师 *2023年1月 - 2024年8月* 地点:新泽西州新不伦瑞克 - 使用Python、NumPy、Pandas、JavaScript、SQL和Chroma向量数据库设计、构建并部署了一个代理式RAG系统,自动化解析和总结了超过5000份研究文档。 - 使用OpenAI和React框架构建了一个高级代理式RAG系统,将入职时间减少了50%,研究效率提高了40%。 - 与15名学术研究人员组成的跨职能团队合作,将200多个反馈点整合到NLP系统中,使平台与当前和未来的研究目标保持一致。 - 每月为10多名员工举办ML使用研讨会,实现了80%的ML增强工作流程在组织中的采用率。 - 使用AWS SageMaker进行模型微调,并使用AWS Bedrock在生产环境中提供服务。 ### Fiskkit公司 - 机器学习工程师 *2020年1月 - 2021年7月* 地点:加利福尼亚州旧金山 - 使用Python PyTorch(C++ CUDA)将NLP驱动的功能集成到Node.js后端,实现了实时文本生成和摘要功能,响应时间减少了70%。 - 使用Python PySpark、NumPy和Pandas进行数据预处理和数据探索,确保高质量的数据集成,使用PyTorch分布式将模型训练结果提高了20%。 - 通过TensorRT的量化和剪枝技术优化了深度学习模型,推理延迟减少了40%。 - 使用Neo4j和Cypher查询构建了一个语义图数据库,用于存储和查询复杂关系,数据检索效率提高了60%。 ## 重点项目 ### 企业级RAG系统 *花旗集团* 使用LangChain、pgvector和AWS Bedrock构建了一个用于金融文档分析的综合RAG系统 技术栈: - Python - FastAPI - LangChain - Postgres - pgvector - AWS Bedrock ### 医疗研究助手 *RWJUH* 使用OpenAI API、向量数据库和React为医学研究人员开发了一个AI助手 技术栈: - Python - React - OpenAI - Chroma DB - AWS SageMaker ### NLP文本分析平台 *Fiskkit* 使用Node.js后端和PyTorch模型创建了一个NLP驱动的文本分析平台 技术栈: - Node.js - Python - PyTorch - PySpark - Neo4j ## 技能专长 ### 生成式AI - LLM微调 - 参数高效微调 (PEFT) - 检索增强生成 (RAG) - 代理式RAG系统 - 知识图谱 (RDF) - 知识图谱 (LPG格式) - GraphRAG - OpenAI GPT - Google Gemini - Anthropic Claude - LangChain - LangGraph - 提示工程 - RLHF ### 机器学习与NLP - PyTorch - TensorFlow - Keras - Transformers - HuggingFace - 自然语言处理 (NLP) - spaCy - NLTK - 特征工程 - 统计建模 - 量化 - 剪枝技术 - 模型评估 - 性能分析 - 神经网络 - GANs - Stable Diffusion ### 数据工程 - Postgres with pgvector - FAISS - Chroma - Neo4j - Cypher - MySQL - PostgreSQL - Oracle - Elasticsearch - MongoDB - PySpark - Pandas - NumPy - Apache Spark - Hadoop - ETL工作流 - 数据处理管道 ### 编程 - Python - FastAPI - Streamlit - PyTest - JavaScript - Node.js - React - Scala - Java - C++ - REST API开发 - gRPC - JWT - 认证系统 ### DevOps与MLOps - Docker - Kubernetes - OpenShift - CI/CD管道 - 开发工作流 - AWS SageMaker - AWS Bedrock - AWS S3 - AWS EC2 - AWS Lambda - AWS Glue - Azure云服务 - MLflow - RAGAS ### 专业与软技能 - 技术沟通 - 文档编写 - 团队协作 - 跨职能领导 - 利益相关者管理 - 客户演示 - 指导 - 培训 - 敏捷方法论 - 项目管理 ## 教育背景 ### 计算机科学硕士,机器学习专业 - 新泽西州立大学罗格斯分校 *2020年12月 - 2022年12月* 绩点:GPA: 3.71 ### 计算机科学学士 - 新泽西州立大学罗格斯分校 *2017年9月 - 2020年9月* ## 语言能力 - 英语(母语,流利) - 中文(母语,流利) ## 认证证书 ### AWS认证机器学习 - 专业 (MLS-C01) *亚马逊网络服务* - 2024年6月 该认证验证了在AWS上构建、训练、调优和部署机器学习、深度学习、生成式AI和LLM模型的专业知识。 ## 教学经历 ### 助教 - 罗格斯大学 *2020年12月 - 2022年12月* 为400多名学生辅导计算机科学和机器学习相关课程 ## 其他信息 ### 出版物 - Berns, M. P., Nunez, G. M., Zhang, X., et al. (2024年9月). 永久性噪声性听力损失后的听觉决策缺陷。 ## 兴趣爱好 - 生成式AI - 潜水 - 阅读 - 哲学 - 心理学 - 社会学 --- 简历由结构化数据生成 - 访问完整交互版本:https://www.shanechang.com/zh-cn/%E5%85%B3%E4%BA%8E%E6%88%91/