张欣耕 (Shane Zhang)

AI/ML工程师,LLM专家,RAG专家
Profile image

拥有超过5年经验的AI/ML工程师,专注于微调大型语言模型(LLM)和构建高级代理式检索增强生成(RAG)系统。对AI充满热情,致力于掌握新兴技术以解决现实问题并增强人类创造力。我的梦想是见证第一个通用人工智能(AGI)的发展。我具备将AI模型从实验室带到实际产品的能力,这些产品已触及数百万用户。

Work Experience

AI/ML工程师

花旗集团美国公司 | 2024年8月 - 至今

新泽西州拉瑟福德

  • 使用Python构建了快速的结构化数据处理管道,将每份文档的处理时间从10秒减少到1秒以内,文档处理效率提高了90%。
  • 使用Python FastAPI设计和加速了一个强大的RESTful API,用于实时数据摄取和NLP处理到Postgres SQL数据库,支持每天超过100万次API调用。
  • 使用OpenShift和Apache Spark部署了规模化解决方案,在120天内实现了零停机的CI/CD流程。
  • 利用Python和LangChain构建了高级代理式RAG系统和知识图谱(RDF和LPG格式),提高了全球检索的准确性,将AI驱动的合规分析的F1分数从0.32提高到0.71。
  • 使用LangChain和RAGAS实现了评估指标和可视化,确保LLM质量,将幻觉率降低了30%,错误调查时间减少了60%。
  • 使用OpenAI GPT、Claude和Google Gemini模型,并微调开源LLM模型,开发了定制化和可扩展的代理式RAG系统,每天处理超过20万次API调用。
  • 开发了以人为中心的评估框架(RLHF),用于评估LLM在现实场景中的表现,持续确保与2000多名活跃用户的意图保持一致。
  • 在AWS上部署了可扩展的AI驱动RAG系统,使用S3、EC2、Glue、Lambda、SageMaker和Bedrock进行高效的数据处理和LLM集成管道。
  • 开发并部署了FastAPI接口和gRPC协议,用于在Azure和AWS等云提供商之间进行高效的API集成。

AI/ML工程师

罗伯特·伍德·约翰逊大学医院 | 2023年1月 - 2024年8月

新泽西州新不伦瑞克

  • 使用Python、NumPy、Pandas、JavaScript、SQL和Chroma向量数据库设计、构建并部署了一个代理式RAG系统,自动化解析和总结了超过5000份研究文档。
  • 使用OpenAI和React框架构建了一个高级代理式RAG系统,将入职时间减少了50%,研究效率提高了40%。
  • 与15名学术研究人员组成的跨职能团队合作,将200多个反馈点整合到NLP系统中,使平台与当前和未来的研究目标保持一致。
  • 每月为10多名员工举办ML使用研讨会,实现了80%的ML增强工作流程在组织中的采用率。
  • 使用AWS SageMaker进行模型微调,并使用AWS Bedrock在生产环境中提供服务。

机器学习工程师

Fiskkit公司 | 2020年1月 - 2021年7月

加利福尼亚州旧金山

  • 使用Python PyTorch(C++ CUDA)将NLP驱动的功能集成到Node.js后端,实现了实时文本生成和摘要功能,响应时间减少了70%。
  • 使用Python PySpark、NumPy和Pandas进行数据预处理和数据探索,确保高质量的数据集成,使用PyTorch分布式将模型训练结果提高了20%。
  • 通过TensorRT的量化和剪枝技术优化了深度学习模型,推理延迟减少了40%。
  • 使用Neo4j和Cypher查询构建了一个语义图数据库,用于存储和查询复杂关系,数据检索效率提高了60%。

Projects

企业级RAG系统

花旗集团

使用LangChain、pgvector和AWS Bedrock构建了一个用于金融文档分析的综合RAG系统

Python FastAPI LangChain Postgres pgvector AWS Bedrock

使用OpenAI API、向量数据库和React为医学研究人员开发了一个AI助手

Python React OpenAI Chroma DB AWS SageMaker

使用Node.js后端和PyTorch模型创建了一个NLP驱动的文本分析平台

Node.js Python PyTorch PySpark Neo4j

Education

  • 计算机科学硕士,机器学习专业
    新泽西州立大学罗格斯分校
    2020年12月 - 2022年12月
    GPA: 3.71
  • 计算机科学学士
    新泽西州立大学罗格斯分校
    2017年9月 - 2020年9月

Certifications

  • AWS认证机器学习 - 专业 (MLS-C01)
    亚马逊网络服务
    2024年6月
    该认证验证了在AWS上构建、训练、调优和部署机器学习、深度学习、生成式AI和LLM模型的专业知识。

Teaching

  • 助教
    罗格斯大学
    2020年12月 - 2022年12月
    为400多名学生辅导计算机科学和机器学习相关课程

Publications

出版物

  • Berns, M. P., Nunez, G. M., Zhang, X., et al. (2024年9月). 永久性噪声性听力损失后的听觉决策缺陷。
© 2025 张欣耕. 版权所有。