Skip to content

Latest commit

 

History

History
57 lines (41 loc) · 6.39 KB

2022-2023-Autumn-Term-Openperf-Schedule.md

File metadata and controls

57 lines (41 loc) · 6.39 KB

2022-2023-Autumn-Term-Allspark-Schedule

Introduction

本研讨会延续之前的allspark会议内容和主旨,目标为形成高质量的开源研究与完善的开源研究基础设施。包括以下几个方向和项目:

  • OpenPerf 开源项目,

  • 数据工程的基础设施(包括基于 DataV 和 DataEase的开源大屏工作)

  • 论文、毕业设计中的数据集、任务、Behchmark 等

  • 其他相关议题

研究内容受到Zhan, J. (2022). A BenchCouncil View on Benchmarking Emerging and Future Computing.的启发。分5个层面,大家可以根据自己的兴趣选择相关方向,5个层面分别是:(1)第一层为硬件计算的性能测试,针对于相同的工作负载在不同的硬件设施上的工作情况,可以帮助我们选择硬件设备。(2)第二层是代表性工作负载的测试,例如对图查询算法或者神经网络算法模型的测试,可以帮助我们对算法性能或者准确率进行改进。(3)第三类使用标准化数据集对问题进行隐式定义,这一类是根据不同的问题提出多样化的数据集,每个数据集具备问题定义的一些标准,可以帮助我们获取或者改进针对开源研究的数据集(4)第四类是标准指标的定义,在开源社区与治理领域有很多需要定义的概念和指标,例如什么是活跃度,什么是健康的社区,这些概念和指标需要从数据集中通过科学研究提炼出来,这一类benchmark可以帮助我们促进开源社区与治理业务的研究。(5)第五类是最佳实践,这一类是利用第四类的一些概念与指标,加上对开源社区与治理的经验性研究得出一系列智能化的操作流程,帮助各个开源社区进行治理。

分享形式不限,可以为相关论文,也可以是分享自己的研究进展。相关流程为至少提前一天为在openperf仓库或者在 open-wonderland提交issue或者直接提交md议程的pull request。由 @bifenglin 确认即可。

Information

  • 重复周期:2022/09/15-2023/01/26 20:30-21:45, 每周 (周四)

  • 会议地点

Schedule

时间 分享人 内容 课件链接 视频链接
2022-09-15 陈旭刚、杨鸣、顾叶鸣、翁振杰 硕士毕业论文进度汇报
2022-09-22 毕枫林 开源数据科研基础设施 yuque
2022-09-29 娄泽华 交叉引用数据集研究进展
2022-10-13 毕枫林 openperf三个基础问题和相关数据集介绍 yuque
2022-10-20 韩凡宇 开源项目技术类型标签任务进展
2022-10-27 宁志成
吴双
PaddlePaddle Hackathon 开源社区对比研究
MSR 2023 Mining Challenge: World of Code (WoC) 介绍
yuque
2022-11-03 毕枫林 Openperf研究进展-github bot detection yuque
2022-11-10 伍泰炜
朱志炜
MSR相关论文与比赛题目介绍
大图采样技术介绍
2022-11-17 韩凡宇 开发者价值评估体系
2022-11-24
2022-12-01
2022-12-08
2022-12-15
2022-12-22
2022-12-29
2022-01-05
2022-01-12