Summary
Overview
Work History
Education
Skills
项目经历
活动与特长
Timeline
Generic

方 梓铭

福建

Summary

芝加哥大学应用数据科学硕士在读,具备扎实的数据分析与统计建模基础,熟练使用Python与SQL进行数据处理与分析。具备从数据清洗、特征构建到模型分析与结果解读的完整数据分析能力。曾参与自动驾驶与大模型相关项目,能够基于数据发现问题并提出解决方案。具备良好的逻辑思维与业务理解能力,致力于通过数据驱动业务决策与优化。

Overview

1
1
year of professional experience

Work History

人工智能实习生

广州数据集团有限公司
广州
06.2025 - 09.2025
  • 基于大模型开放服务平台,完成模型调用与应用开发流程
  • 收集并处理法律领域数据,构建高质量数据集用于垂类模型训练
  • 参与垂直领域模型训练与效果评估,提升模型在特定场景下的表现
  • 调研数据合规审查流程,提出自动化审查方案以提升审查效率
  • 开发数据合规审查智能体与数据脱敏智能体,推动数据处理自动化

科研实习生(自动驾驶数据分析方向)

同济大学
上海
07.2024 - 09.2024
  • 使用随机森林模型修正异常驾驶模式数据,提高数据质量与可靠性
  • 处理自动驾驶多源测试数据,清洗并过滤异常值以提升数据可靠性
  • 构建速度相关特征(ASD / ISD / SSD),分析并识别自动驾驶脱离行为
  • 使用 K-means 聚类分类脱离行为,识别风险规避与非风险规避模式
  • 采用非参数统计方法确定最优脱离时间阈值,提高事件识别准确性
  • 构建脱离率与风险规避脱离率模型,评估自动驾驶系统安全性与稳定性

Education

硕士 - 应用数据科学

芝加哥大学
伊利诺伊州
12-2026

学士 - 数据科学

威斯康星大学麦迪逊分校
威斯康星州
05-2025

Skills

  • 编程语言: Python,SQL,R Studio
  • 数据分析: Pandas,NumPy,数据清洗与特征工程,数据探索分析(EDA)
  • 机器学习: 回归模型,随机森林(Random Forest),K-means 聚类,模型评估(AUC、ROC)
  • 时间序列: ARIMA,SARIMA,Prophet
  • 大模型(LLM): Prompt Engineering,AI Agent开发,大模型应用与部署
  • 数据工程: ETL流程,数据管道基础,数据处理与集成
  • 数据可视化: Tableau,Matplotlib,数据可视化分析

项目经历

零售会员与营销效果分析项目

  • 基于交易、营销与用户分群数据进行EDA分析,挖掘销售、用户行为与营销效果关系
  • 设计3NF与星型数据模型,构建客户、产品、门店与营销等维度数据体系
  • 设计并实现ETL流程,完成数据清洗、标准化及多表整合
  • 分析营销活动ROI与用户分群特征,支持业务决策与用户运营优化

再犯风险预测与公平性优化项目(COMPAS替代模型)

  • 基于真实司法数据构建再犯风险预测模型,对比并优化COMPAS算法决策效果
  • 设计Logistic Regression、Decision Tree、Random Forest、XGBoost等模型进行性能对比与选择
  • 通过Precision、FPR、FNR及阈值调优(0.6)优化模型,在降低误判率的同时提升决策可靠性
  • 引入SHAP进行模型解释,识别关键特征(age、priors),验证模型不依赖种族变量
  • 进行公平性分析,相比COMPAS显著降低对Black群体的误判率(False Positive)
  • 构建可解释决策逻辑并输出个体级预测(Travis case),支持司法决策建议

活动与特长

  • 芝加哥大学华人足球队(校内联赛/中美杯前三)
  • Madison Asian Rap Zone社团音乐制作人(原创伴奏制作)
  • CSSA社团多媒体部门负责人(视频制作与活动宣传)

Timeline

人工智能实习生

广州数据集团有限公司
06.2025 - 09.2025

科研实习生(自动驾驶数据分析方向)

同济大学
07.2024 - 09.2024

硕士 - 应用数据科学

芝加哥大学

学士 - 数据科学

威斯康星大学麦迪逊分校
梓铭