本研讨会延续之前的allspark会议内容和主旨,目标为形成高质量的开源研究与完善的开源研究基础设施。包括以下几个方向和项目:
-
OpenPerf 开源项目,
-
数据工程的基础设施(包括基于 DataV 和 DataEase的开源大屏工作)
-
- 开源基础设施数据仓库文档allspark
- 可视化研究文档openinsight
-
论文、毕业设计中的数据集、任务、Behchmark 等
-
其他相关议题
研究内容受到Zhan, J. (2022). A BenchCouncil View on Benchmarking Emerging and Future Computing.的启发。分5个层面,大家可以根据自己的兴趣选择相关方向,5个层面分别是:(1)第一层为硬件计算的性能测试,针对于相同的工作负载在不同的硬件设施上的工作情况,可以帮助我们选择硬件设备。(2)第二层是代表性工作负载的测试,例如对图查询算法或者神经网络算法模型的测试,可以帮助我们对算法性能或者准确率进行改进。(3)第三类使用标准化数据集对问题进行隐式定义,这一类是根据不同的问题提出多样化的数据集,每个数据集具备问题定义的一些标准,可以帮助我们获取或者改进针对开源研究的数据集(4)第四类是标准指标的定义,在开源社区与治理领域有很多需要定义的概念和指标,例如什么是活跃度,什么是健康的社区,这些概念和指标需要从数据集中通过科学研究提炼出来,这一类benchmark可以帮助我们促进开源社区与治理业务的研究。(5)第五类是最佳实践,这一类是利用第四类的一些概念与指标,加上对开源社区与治理的经验性研究得出一系列智能化的操作流程,帮助各个开源社区进行治理。
分享形式不限,可以为相关论文,也可以是分享自己的研究进展。相关流程为至少提前一天为在openperf仓库或者在 open-wonderland提交issue或者直接提交md议程的pull request。由 @bifenglin 确认即可。
-
重复周期:2022/09/15-2023/01/26 20:30-21:45, 每周 (周四)
-
会议地点
-
- 腾讯会议 点击链接入会,或添加至会议列表: https://meeting.tencent.com/dm/dE6Z3Js5PV9p# 腾讯会议:507-9381-4853
- 线下地点待定
时间 | 分享人 | 内容 | 课件链接 | 视频链接 |
---|---|---|---|---|
2022-09-15 | 陈旭刚、杨鸣、顾叶鸣、翁振杰 | 硕士毕业论文进度汇报 | ||
2022-09-22 | 毕枫林 | 开源数据科研基础设施 | yuque | |
2022-09-29 | 娄泽华 | 交叉引用数据集研究进展 | ||
2022-10-13 | 毕枫林 | openperf三个基础问题和相关数据集介绍 | yuque | |
2022-10-20 | 韩凡宇 | 开源项目技术类型标签任务进展 | ||
2022-10-27 | 宁志成 吴双 |
PaddlePaddle Hackathon 开源社区对比研究 MSR 2023 Mining Challenge: World of Code (WoC) 介绍 |
yuque | |
2022-11-03 | 毕枫林 | Openperf研究进展-github bot detection | yuque | |
2022-11-10 | 伍泰炜 朱志炜 |
MSR相关论文与比赛题目介绍 大图采样技术介绍 |
||
2022-11-17 | 韩凡宇 | 开发者价值评估体系 | ||
2022-11-24 | ||||
2022-12-01 | ||||
2022-12-08 | ||||
2022-12-15 | ||||
2022-12-22 | ||||
2022-12-29 | ||||
2022-01-05 | ||||
2022-01-12 | ||||