• 开发了用于 Llama-2-7b-chat 模型的链式思维提示系统,以提高数学问题解决能力。
• 利用 Transformers 实现了 Python 脚本,用于模型交互和链式思维优化。
• 创建了一个两步骤的链式思维策略,用于提取和应用数学原理。
• 利用正则表达式进行模型生成的数学解的解析和答案验证。
• 管理 MathQA 数据集处理,用于模型训练和评估。
• 在团队中合作,专注于链式思维开发和项目讨论。
• 在定义的立方状态空间中实现了用于最优无人机着陆的强化学习模型。
• 应用策略迭代和价值迭代算法,提升了无人机的着陆精度。
• 整合动态奖励结构,优化无人机的路径规划到着陆点。
• 利用一个折扣率来控制和维持奖励在80%左右,确保了一致的性能。
• 尝试了多种奖励结构,分析它们对性能的影响。
• 在理解基础理论方面面临挑战,特别是Q-learning的复杂性,但通过严谨的研究和实际应用克服了这些挑战。
• 利用Python在Jupyter Notebook中进行简化的编码和文档记录。
• 通过道德黑客方法进行网络安全评估:SQL注入、跨站脚本攻击(XSS)、跨站请求伪造(XSRF)
• 对初创公司网站进行安全漏洞分类处理,并发现了多个安全漏洞 • 带领三人团队分析安全功能并开发攻击方法
• 通过GitHub研究各种黑客方法,提高黑客和编码效率
• 优化黑客方法和代码生成,提高运行效率
• 回顾和分析网站安全响应政策和程序,寻找潜在风险
• 主持每周讨论会议,并跟进团队项目进展
拥有超过5年的C非实习编程经验,专注于面向对象编程和数据结构。
在Python编程方面拥有超过2年的经验,主要用于强化学习、LLM提示和算法设计等领域。
擅长算法开发,具有线性代数、离散数学和计算理论基础,包括有限状态自动机和图灵机概念。能够分析时间和空间复杂度。
在计算机安全方面有一定的知识储备,拥有1年的学习经历,包括汇编语言、网络安全(SQL注入、跨站脚本攻击)、网络安全和密码学。
有1年的前端网页开发经验,利用HTML、CSS和JavaScript设计用户界面,并尝试过与后端数据库进行交互。
熟悉MySQL,包括提取数据,分析数据和建立数据库仓库。
能过运用基本的GitHub命令,与团队成员制定计划并有效合作,遵循和完成既定的工作流程。