Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

🐉 X-lab 2024 Roadmap #364

Open
1 of 16 tasks
will-ww opened this issue Feb 9, 2024 · 1 comment
Open
1 of 16 tasks

🐉 X-lab 2024 Roadmap #364

will-ww opened this issue Feb 9, 2024 · 1 comment

Comments

@will-ww
Copy link
Contributor

will-ww commented Feb 9, 2024

随着 X-lab Day 的年度总结,像 2023 年 Roadmap 一样,开启此帖子制定 2024 年度 Roadmap 规划。同时,参考春节期间的 2023 年度总结,能够有非常多的启发与思考。

1、规划原则

围绕“开源数字生态”的数据采集、分析挖掘、业界应用等多方面工作,已取得了实质性关键成果,包括:

  • 数据基础设施:GitHub/Gittee(数据)+ 数据管理系统(工程) + OpenDigger(界面)
  • 数据分析服务:OpenRank(模型 / 指标)+ HyperCRX(可视化) + OpenLeaderboard(排名)
  • 业界落地场景:OpenSODA(高校)+ OpenDashboard(企业)+ 开源生态洞察(基金会)
  • 科研标准产出:OpenDigger(事实标准) + 开源治理标准(国家标准)+ ICSE / ICPC(国际顶会)
  • 卓越人才培养:KTH / 苏大(学术界) + 阿里 / 蚂蚁 / 字节(工业界)+ 开放原子顾问(基金会)

X-lab 达成了初步的价值创造,进入到一个价值推广影响力提升的新阶段。同时,结合全球趋势与热点,从“数字产品供应链”、“数据要素流通”、以及“AIGC / LLM 创新技术”三大新视角对新阶段进行规划。包括:

  • 应用场景:结合全球趋势热点国家战略需求企业核心痛点、以及个人组织兴趣,进行深度挖掘
  • 典型任务:结合跨学科视角,定义支撑应用场景落地的科学问题与任务,例如软件工程问题、数据科学任务等
  • 关键技术:针对上述问题与任务,开展关键技术研发工作,例如数据分析技术、隐私安全技术、大模型技术等
  • 效果评价:从不同层面开展工作效果评价,例如项目推广效果(e.g. 装机量)、产品商业化程度(e.g. 营收)、学术影响力(e.g. 顶会论文发表)、指标与数据采纳度(e.g. 报告引用数)等

几个重要的核心原则包括:

  • 持续聚焦开源领域数据价值
  • 通过产品思维挖掘商业价值
  • 专心致志做很久很久,只做有积累效应的事情
  • 开放式合作,用开源的方式开源的事情

2、行动框架

充分借鉴过去一年当中所积累的知识框架、开源项目、落地成果,如下图所示。

image

3、重点事项

(1)以 OpenRank 为核心开展应用场景构建与推广

设计 OpenRank 供应链生态战略,打造 OpenDigger 生态圈。

  • 知识体系建设:明确定义 OpenRank 的知识体系推广策略(e.g. 白皮书、商标申请等)
  • 学研侧推广:课程 + 大赛 + 科创 + 评价(e.g. 教师评价、学生评价等)
  • 产业侧推广:OSPO 工具箱(专家知识) + OpenLeaderboard(行业标准) + 开源治理大屏(企业案例
  • 社区测推广:HyperCRX(和长期激励机制做结合,例如 OSPP)
  • 基金会推广:开放原子(全球洞察大屏 + 开源指数 + )+ 天工开物大屏(供应链大屏 + 高校排行榜)

(2)以 OpenShare 为核心的产品研发与应用推广

(3)知识体系构建与技术创新

4、落地项目

十大重点工程:


外部合作机会:

  • K 开放原子开源基金会对接@frank-zsy
  • L 天工开物开源基金会对接
  • M 蚂蚁集团对接@xiaoya-yaya
  • N 中科院软件所 & OSPP 对接
  • O 电子协会 - 开源学术大会
  • P 海外合作与对接
@bifenglin
Copy link
Contributor

bifenglin commented Mar 13, 2024

实验室网站重构与运营

新网站地址:https://github.com/X-lab2017/X-lab-website
使用技术:Docusaurus
功能拆解:
1.实验室概览简介页(要求图文,视频介绍)
2.实验室成果概览页(工业界活动、横向项目,获奖的荣誉)
3.实验室学术成果(发过的论文,研究的课题)
4.实验室成员展示页(过往硕博生的去向,行业)
5.实验室招生简章(要求学生的能力,给出新手教程)

目前需要确定如何任务分发

GPTOSS

3月-4月30日

  1. 完成OSSGPT调研和语言处理类任务拆解。
  2. 完成开源大模型的基座项目,可以用公开数据集进行初步benchmark实验

5月-6月30日

  1. 完成2类OSS语言类任务的数据集制作,并且进行评测
  2. 完成2累OSS语言类任务的大模型微调改进

目前需要确定主要成员

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants