Github1.9KStar的数据治理框架Amundsen如何理解

这期内容当中小编将会给大家带来有关Github 1.9K Star的数据治理框架Amundsen如何理解，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

创新互联的客户来自各行各业，为了共同目标，我们在工作上密切配合，从创业型小企业到企事业单位，感谢他们对我们的要求，感谢他们从不同领域给我们带来的挑战，让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。专业领域包括网站设计、做网站、电商网站开发、微信营销、系统平台开发。

Amundsen的使命，整理有关数据的所有信息，并使其具有普遍适用性。

这是Amundsen官网的一句话，对于元数据的管理工作，复杂且繁琐。可用的工具很多但各有千秋，数据血缘做的较好的应该是Apache Atlas，而数据可视化做的较好的应该是Apache Superset。业界一直需要一个可以整合这些功能，让数据治理更加的简单便捷，而这正是Amundsen的使命。

类似于Atlas (Apache)，Datahub (LinkedIn)。Amundsen主要在于提高数据分析师，数据科学家和数据工程师的工作效率。它可以通过为数据资源建立索引，并通过一定的机制来支持在页面上进行排名搜索。可以将其视为搜索功能，但搜索的是元数据。该项目以挪威探险家Roald Amundsen（第一个发现南极的人）的名字命名。

Amundsen由LF AI＆Data基金会维护。LF AI＆Data是Linux Foundation的保护基金会，支持人工智能，机器学习，深度学习和数据方面的开源创新。

Github 1.9K Star的数据治理框架Amundsen如何理解

目前Amundsen在github有1.9kStar，还没有Releases的版本，项目正处于蒸蒸日上的上升期。

Github 1.9K Star的数据治理框架Amundsen如何理解

架构

下图显示了Amundsen的总体架构。

Github 1.9K Star的数据治理框架Amundsen如何理解

可见，Hive，Presto等数据源通过Databuilder ingestion框架获取元数据，写入Elasticsearch和Neo4j，通过搜索服务与元数据服务提供给前端。

主要模块如下：

前端服务

作为用户交互的web页面。

这是基于Flask的Web应用程序，页面是React构建的。

搜索服务

搜索服务采用Elasticsearch的搜索功能（或者Apache Atlas），并提供一个RESTful API服务。

元数据服务

元数据服务目前使用的Neo4j的图数据库进行交互。

功能展示

Amundsen提供了搜索，推荐，表描述，数据预览在内的非常多的功能，数据血缘功能正在研发中。

以上是部分功能展示：

登陆页面：Amundsen的登陆页面

Github 1.9K Star的数据治理框架Amundsen如何理解

搜索预览：查看搜索结果

Github 1.9K Star的数据治理框架Amundsen如何理解

表的详细页面：Hive 等表的可视化

Github 1.9K Star的数据治理框架Amundsen如何理解

列详细信息：主要是一些列的统计信息

Github 1.9K Star的数据治理框架Amundsen如何理解

数据预览页面：表数据预览的可视化，可以与Apache Superset或其他数据可视化工具集成。

Github 1.9K Star的数据治理框架Amundsen如何理解

集成

Amundsen支持的数据源非常多。

Apache Druid，Apache Hive，CSV，Oracle，

MySQL，Delta Lake等等。

Amundsen还可以连接到任何提供dbapi或sql_alchemy接口的数据库。

同时Amundsen还支持和一些仪表盘的集成，比如

Redash，Tableau。

ETL工具的集成，Apache Airflow。

BI可视化工具，Apache Superset。

上述就是小编为大家分享的Github 1.9K Star的数据治理框架Amundsen如何理解了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注创新互联行业资讯频道。

网站题目：Github1.9KStar的数据治理框架Amundsen如何理解
当前网址：http://scyanting.com/article/ggidog.html

其他资讯