Airbnb开放来源数据 - 科学共享平台

2021-10-19 17:46:01来源:

大多数组织都有很好的审查和共享计算机代码程序。但数据分析怎么样?

重要调查结果通常在“一个混合的演示文稿,电子邮件和谷歌文档”中持有Airbnb的工程和数据科学团队的两名成员在2月份博客。当组织中的某人想要找到和使用现有的工作时,他们通常必须追踪更新的代码和浪费时间检查并再现早期结果。然后他们通过演示,电子邮件或Google Doc,延伸周期“LL通常分发自己的调查结果”。“

在考虑如何解决这个问题的各种想法之后,Airbnb创建了一个内部知识回购,结合了Git版本控制和Markdown模板来报告结果。Airbnb最近开辟了知识存储库测试版,寻求贡献者帮助前进的项目。

Git允许同样的对等审查和版本控制,该版本控制器通常用于在代码上协作,而Markdown在单个,易于可重复的文件中提供文本和代码的混合。您可以看到RStudio的教程在R Markdown中获取更多信息,以获取一般可以做的Markdown的更多信息。Markdown适用于Python等其他语言。

Airbnb Framework设置需要Python并以多种格式支持“知识帖子”。

“帖子是用Jupyter笔记本,Rarkndown文件或纯粹的标记编写的,但所有文件(包括查询文件和其他脚本)都已提交。每个文件都以少量的结构化元数据开始,包括作者,标签和TLDR,“根据中柱,Airbnb的缩放知识。“Python脚本验证内容并将帖子转换为具有Markdown语法的纯文本。我们使用GitHub的Pull请求系统进行审阅过程。最后,有一个烧瓶网站应用程序,使repo的内容作为内部博客,按时间,主题或内容组织。

“它为”知识帖子“提供了各种数据商店(和实用程序),用于”知识帖子“,特别关注笔记本电脑(R Markdown和Jupyter / IPython Notebook)以更好地促进可重复的研究,”根据GitHub存储库。“知识存储库是一项正在进行的工作。有许多代码清理和特征扩展TBD。您的帮助和参与不仅仅是鼓励。“


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章