<dfn id="hx5t3"><strike id="hx5t3"><em id="hx5t3"></em></strike></dfn>

    <thead id="hx5t3"></thead><nobr id="hx5t3"><font id="hx5t3"><rp id="hx5t3"></rp></font></nobr>

    <listing id="hx5t3"></listing>

    <var id="hx5t3"></var>
    <big id="hx5t3"></big>

      
      

      <output id="hx5t3"><ruby id="hx5t3"></ruby></output>
      <menuitem id="hx5t3"><dfn id="hx5t3"></dfn></menuitem>

      <big id="hx5t3"></big>

        GitHub 2020 數字洞察報告:JavaScript 和 Python 蟬聯冠亞軍,HTML、CSS 全域語境下更受歡迎

        思否編輯部

        圖片

        摘要:開源軟件已經成為人類數字社會的基石,是全人類共同努力的結晶,開源協作對人類數字文明的發展起到了巨大的推動作用。GitHub 作為全球范圍內最主要的開源協作平臺,無數個開源社區在其上孕育而生,其背后海量的開發者行為數據蘊含了大量的個體貢獻規律、群體協作模式、社區健康狀況、生態發展趨勢、以及商業戰略價值。

        《GitHub 2020?數字洞察報告》是由 X-lab 開放實驗室發起,聯合多家科研機構與開源社區所共同完成的一個反映全球開源現狀與趨勢的開源項目。報告涵蓋了當今全球開源的總體情況分析、開發者分析、項目分析、領域案例、每月之星等眾多內容,希望以此繪制人類的"開源數字生態地圖",推動開源社會創新,繁榮開源數字文明。


        引言

        2020 注定是個不平凡的數字,開源的 2020 也是如此。

        即便是在新冠疫情肆虐的今天,開源依舊大發展,甚至發展的更加迅速。從各項數據指標都能發現:GitHub 的日志數 2020 年達到了 8.6 億條,相較 2019 年增長了 42.6%;活躍代碼倉庫達到了 5,421 萬個,相較 2019 年增長了 36.4%;活躍開發者數達到了 1,454 萬人,相較 2019 年增長了 21.8%。

        管理學大師彼得·德魯克曾經說過:“你如果無法度量它,就無法管理它”(If you can not measure it,?you can not manage it),進而也無法提高它,而軟件行業至今也還沒有找到一個可以有效度量軟件開發生產效率(Productivity)的方法。

        整個開源生態系統更是如此,個體如何度量、社區如何度量、管理者如何利用這些數字做更好的決策,這些都是問題。但在我們看來,這些既是挑戰,也是機遇。要想有效的開展開源治理的工作,就難以繞開度量的問題,GitHub 全域數據給予了我們這樣一個極佳的機會。

        度量也是一把雙刃劍。度量具有極強的引導性,它會激勵你重視并改善能夠度量的元素,但也可能使你忽視無法度量的元素并使之惡化。在全球大規模的開源社區與生態構建的過程當中,如何找到合理的度量,并合理的利用這些度量呢?希望本報告能夠給大家帶來一些啟示,這也是本報告的重要目的之一。

        今年的《GitHub 2020 數字洞察報告》主要的變化包括:

        • 整個報告的迭代以開源項目的形式協作完成,涉及數據、代碼以及文字內容;
        • 提出更加全面的度量指標,以及更加科學的計算方法;
        • 用更加專業化、豐富的手段進行數據可視化與洞察;
        • 在活躍度的基礎上,更加關注時間維度、多樣性維度、協作網絡維度上的信息;
        • 首次提出開源星系(OpenGalaxy)與開源象限(OpenQuadrant)的概念,并進行了落地實現;
        • 增加了單個項目開發者協作網絡的深度分析案例;
        • 增加了短期內受到大量關注的開源每月之星內容。

        本次報告的主要開源洞察概述如下:

        1. 全球開源事業大發展,社區活躍行為、開發者數量、開源倉庫數量均大幅提升;
        2. 開源軟件生產流水線自動化程度大幅提升,多樣化的數字協作機器人成為主流;
        3. 基于海量數據的活躍度模型能夠有效地持續反映開發者與社區的整體狀況;
        4. 主流開發者的工作時間具有較強規律,并和工作時間開始重合,公司化開源成為絕對主流,996 開源項目開始出現;
        5. 美洲開發者分布最多,歐洲擁有最高的單時區開發者比例,亞洲開發者數量依然較少,中國相較其他亞洲國家具有較高的開源活躍度;
        6. JavaScript 和 Python 依舊是語言排行榜上的冠亞軍,HTML 和 CSS 在全域開發者語境下更受歡迎,而 TypeScript 和 Rust 語言則上升明顯;
        7. 谷歌、微軟等老牌企業依舊為活躍的開源貢獻大戶,國內的企業阿里活躍度排名第一,PingCAP 的表現則非常亮眼;
        8. 第一次通過開源星系認識 GitHub 開源項目的全貌,主流技術領域的開源生態已經形成,新的開源社群則不斷涌現,極少量項目還是協作孤島;
        9. CNCF、LF、Apache 等基金會在技術領域上各有側重,通過開源象限能夠進一步區分同類項目的發展階段與成熟水平;
        10. 開發者時區分布圖和協作網絡成為開源社區多樣性與健壯性的有效分析手段,能夠更好地指引社區經理的開源治理工作。

        以下是《GitHub 2020 數字洞察報告》正文。

        一、總體情況

        從總體數據來看,2020 年全年,GitHub 全域事件日志數量總計約 8.6 億條,較 2019 年 6.1 億條增長約 42.6%,是近五年來增長最快的一年。本次報告通過項目與開發者行為數據,統計得到 2020 年 GitHub 全域活躍項目數量約 5,421 萬個,活躍開發者賬號約 1,454 萬個,分別較 2019 年增長了 36.4%?與 21.8%。

        圖片

        GitHub 2015 - 2020 年事件日志量、活躍倉庫數量、活躍賬號數量總體情況

        二、開發者分析

        開源世界的核心是貢獻開源的開發者們,如同 Apache Way 所推崇的 Community Over Code,由開發者組成的社區才是開源生命力的源泉。本報告將從全域開發者活躍情況、GitHub Apps 使用情況、開源開發者典型工作時間畫像、全球開發者時區分布、開發者使用語言分布等多個角度對 GitHub 2020 年全域開發者進行全面分析。

        全域開發者活躍情況

        通過對全域開發者進行活躍度與活躍倉庫數量的統計,我們得到 GitHub 全域開發者的活躍度分布情況和單個開發者活躍倉庫數量分布情況如下:

        圖片

        開發者活躍度與活躍倉庫數量分布圖

        經統計,活躍度超過 2,000 的開發者數量為 5,445 個,占全域開發者數量不足萬分之六。而大部分開發者活躍度都在 [0, 500] 區間內,占全域開發者數量的 99.45%,說明大多數開發者還是處于低活躍度的一個狀態。

        觀察曲線尾部,我們發現開發者活躍倉庫數量在最后有一個回升,其實是由于部分未被過濾掉的自動化協作類賬號的活躍倉庫數量巨大,遠超正常人類開發者,因此尾部形成 V 形曲線。

        另外,我們通過活躍度統計了全域活躍排名最高的 10 個開發者,其中 8 個賬號為 GitHub Apps,另外兩個賬號為自動化協作的開發者賬號。

        圖片

        GitHub 2020 年全域開發者賬號活躍度統計 Top 10

        自動化協作機器人由于運行在服務端,可以同時服務于眾多項目,從而具有極高的活躍度和協作倉庫數量。

        本文所涉及到的諸如活躍度的詳細計算方法請參閱完整的報告內容。

        GitHub Apps 使用情況

        在全球最活躍開發者賬號中,大部分為 GitHub Apps,故本報告對 GitHub Apps 數據做出相關統計,GitHub Apps 年活躍賬號數量(活躍數量)與所產生日志總量占全年日志占比(日志占比)的變化如圖所示。

        圖片

        GitHub Apps 活躍賬號數量與日志占比

        通過圖可以看到,GitHub Apps 自 2016 年推出以來,在近年得到了迅猛發展。從日志占比來看,2019 年相較于 2018 年提升了 288%,2020 年相較 2019 年增長 141%,達到了 12% 以上。

        未來,基于 GitHub Apps 的自動化協作機器人會被更加廣泛的用于項目的自動化協作,更好的幫助開源項目進行大規模協作的管理。

        全域日志時間分布

        由于 GitHub 事件日志具有詳細的時間戳信息,故可以通過對時間維度的統計分析進行洞察,例如在 UTC 標準時間下,全球的工作時間分布如圖所示。

        圖片

        GitHub 2020 年全球日志時間分布情況

        若我們認為主流開發者正常的工作時間為每日 9 時至 21 時,則在全球視角下,通過日志量來看,可以看到 GitHub 平臺上的開發者由歐美主導。而且周末的活躍明顯低于工作日,也與 GitHub Octoverse 2020?報告中更多開發者使用 GitHub 工作而不僅僅是基于興趣開發相吻合。

        全球開發者時區分布

        開發者的地理分布情況一直是開源項目全球化指標的一個重要方面。通過對 GitHub 全域開發者活躍度前 5 萬名開發者的統計,我們得到全球開發者在各時區分布估計如圖所示。

        圖片

        GitHub 2020 年全球開發者時區人數分布圖

        可以看到,在高活躍開發者中,美洲(美國、加拿大、南美)開發者分布最多,雖然單時區的開發者比例不是最高,但總體開發者占比高達 33% 左右。而歐洲擁有最高的單時區開發者比例。亞洲的開發者數量依然較少,但中國、俄羅斯開發者相較其他國家還是有較高的開源活躍。而太平洋地區則由于人口分布原因,開發者比例最低。

        三、項目分析

        全域項目總體數據

        基于開發者活躍度定義,我們也給出開源項目活躍度的計算方法。在給定的活躍度計算方法下,過濾了 GitHub Apps 相關賬號的協作行為,共統計得到 2020 年有效的總活躍項目數量約 1167 萬個。這些項目的活躍度分布情況與項目中的參與開發者數量分布情況如下圖所示。

        圖片

        GitHub 2020 項目活躍度及參與開發者數量分布情況

        經統計,2020 年全年項目的活躍度值最高為 971.1,但高活躍度的項目數量占比極低,超過 99.95% 的項目活躍度值都低于 10,即絕大部分項目處于低活躍狀態。另外,項目中的參與開發者數量最高達 85546 ,即在 2020 年內最多有 85546 個開發者參與了同一個項目。但有 71.21% 的項目參與開發者數量都低于 10,即 2020 年全年 GitHub 上大部分項目的參與人數都在 10 人以內。

        項目活躍度 Top 20

        根據項目活躍度定義,我們對 2020 年全年活躍項目進行了活躍度統計與排名,這里給出世界活躍度 Top 20 項目的列表。

        圖片

        GitHub?2020?年全域項目活躍度?Top 20

        同時,我們也通過各種渠道采集了中國的開源項目列表,并同樣給出了中國項目的活躍度排名情況,如下表所示。

        圖片

        GitHub?2020?年中國項目活躍度?Top 20

        從這個列表中,我們發現,PingCAP 在開源領域的表現非常地亮眼。Top 20 項目中上榜的項目有6個。阿里在開源領域中的成績也是非常不錯。Top 10項目中上榜的項目有2個。百度在人工智能領域的表現非常不錯,其深度學習平臺 PaddlePaddle 占據了2個項目。

        中國的 Top 20 項目列表中,包括阿里Ant-Design 組件庫,京東基于 React 前端框架的開發框架 taro,由餓了么(已被阿里收購)前端團隊開源的 Vue UI 組件庫Element等等,這說明了在國內,前端群體在社區更為活躍;另外前端代碼一般也不太涉密,因此公司在心態上更開放一些。不過這其中也有一點需要引起注意,上榜的前端項目組件庫居多,但是缺少核心項目。

        而在各大開源項目的背后,基本都有科技公司的支持,我們計算出了科技公司所維護的開源項目在 2020 年的活躍情況,結果如下表所示。

        圖片

        GitHub?2020?中國企業開源項目活躍度一覽

        在國內企業的開源數據中,我們可以看到阿里巴巴的數據在很多指標上的表現里都非常不錯,有的指標值甚至是其它公司之和,并且在社區化/開放等方面也做得不錯。

        OpenGalaxy

        通過活躍度的數據統計得到的結果會受到自動化協作行為的影響,并且不同生命周期階段的項目的活躍度可能不具備可比性,故在本次報告中我們引入了全域項目協作關系網絡,開源星系?——?OpenGalaxy。

        圖片

        GitHub 2020 全域項目協作關系網絡——OpenGalaxy 2020

        GitHub 2020 最活躍的 22.1 萬個開源項目組成的協作網絡圖。該圖中節點的大小表示項目的影響力大小,節點的著色表示節點所屬的協作聚類結果。在協作網絡的影響力評估下,得到 GitHub 2020 全域影響力最高的項目 Top 20 如下表所示。

        圖片

        OpenGalaxy?2020?全域項目影響力?Top 20

        可以看到,VSCode 的影響力從活躍度的第 5 躍升為第 1,且高于排名第 2 的 flutter 約 64.7%,以巨大的優勢成為全球最具影響力的項目。事實上這是由于 VSCode 在成為全球最流行的 IDE 的同時,也與其他各領域的頂級項目產生了大量的協作關聯。

        OpenGalaxy 具有優秀項目會因優秀開發者而關聯在一起的特性,從而不會因自動化行為導致影響力指標虛高,具有較好的算法穩定性,影響力指標的變化背后一定意味著開發者群體的活躍行為遷移,從而可以較好的反映出 GitHub 全域的項目影響力狀況。其它詳細內容請參見完整的報告正文。

        四、案例分析

        本報告提出一種開源象限(OpenQuadrant)的方法來分析一個開源項目在影響力、全球化、社區規模三個核心特性方面的表現?;谠撻_源象限分析,使用散點圖來表示,橫縱兩個維度為項目影響力指標和項目全球化指標,為了方便可視化,我們采用取對數的形式呈現上述兩個指標,而使用散點圖上的點的大小來刻畫項目參與的活躍人數,用來反映一個項目的社區規模。

        基于以上,開源象限將整個平面分成了四塊區域,分別是:

        • 前瞻(Foresighted):落在該區域的項目影響力強,同時項目全球化程度高;
        • 引領(Leading):落在該區域的項目影響力強,但項目全球化程度較低;
        • 行動(Acting):落在該區域的項目影響力較弱,但項目全球化程度高;
        • 進入(Incubating):落在該區域的項目影響力較弱、同時項目全球化程度也較低。

        基金會項目分析

        CNCF 的英文全稱是 Cloud Native Computing Foundation,即“云原生計算基金會”。

        下圖為 CNCF 下云原生領域開發者時區分布圖,可以看到該領域的開發者時區分布與全域項目的開發者時區分布較為接近,說明 CNCF 云原生領域的項目全球化程度較高。

        圖片

        CNCF 下云原生領域開發者時區分布

        CNCF 下云原生領域的開源象限分析可視化結果如下圖所示。Kubernetes項目無論是在影響力、全球化、還是社區開發者體量上面,當之無愧的處于第一的位置。

        圖片

        CNCF 下云原生領域的開源象限

        LF AI&Data 是 Linux Foundation下的一個綜合型基金會,支持人工智能、機器學習、深度學習和數據方面的開源創新。

        LF AI & Data 下數據與人工智能領域的開源象限分析可視化結果如下圖所示??梢钥吹皆擃I域有不少全球化做得比較好的項目,非常符合人工智能全球走熱的趨勢。

        圖片

        LF AI & Data 下數據與人工智能領域的開源象限

        Apache 軟件基金會(ASF)成?于 1999 年, 是?個依據 501(c)在美國成?的非營利性公共慈善組織,基金會的使命是為公共利益而提供軟件。

        Apache 下大數據領域的的開源象限分析可視化結果如下圖所示??梢钥吹皆擃I域的項目整體分布具有較好的分散性,Spark、Flink、Hadoop 等明星項目占據著頭牌位置。

        圖片

        Apache 下大數據領域的開源象限

        Apache 軟件基金會下來自中國的項目的開源象限分析可視化結果如下圖所示??梢钥吹皆擃I域的 Echarts、Skywalking、Dubbo 和 Shardingsphere 四個項目處于第一方陣,體現了較強的實力。

        圖片

        Apache 軟件基金會下中國項目的開源象限

        更加具體的詳細信息請參見完整報告正文。

        VSCode 案例分析

        VSCode 項目作為開源生態中的一顆北極星,在 2020 年依舊保持著旺盛的生命力,這一年,共有 206645 條記錄由 VSCode 產生,相比 2019 年的 121490 條,增長了接近一倍;這一年,VSCode 的項目年平均活躍度分值為 385,在全域項目中排名第 7 位;這一年,有 46639 位開發者(包含協作機器人賬號)在項目中活躍過,在這艘開源航母上發出有力的協作信號。

        同時我們通過開發者在項目中的協作關系構建了 VSCode 在 2020 全年的開發者協作網絡,如圖所示。

        圖片

        VSCode 項目開發者協作網絡

        在這個由 2 萬多個開發者組成的協作網絡中,節點為開發者賬號,邊為協作關系,節點的大小為對應開發者賬號的活躍度。在這個協作網絡中,處在網絡核心位置的較大的節點是 VSCode 的核心團隊成員,他們不僅有很高的活躍度,而且與其他開發者均具有較高的協作關系,這個群體的數量在百人左右。緊接著外側是 VSCode 的重度使用者或貢獻者,他們可能隨時提交 Issue 或 PR 進行討論或貢獻,這個群體的數量在千人級別。最外側,也是最大量的開發者是 VSCode 的一般用戶和偶發貢獻者,大部分僅在自己關心的問題上提問或討論。

        五、每月之星

        除了頂級項目之外,GitHub 上還有一些短期內受到廣大開發者大量關注的項目。這些項目可能是現象級項目,也有可能在未來成為頂級項目。這些項目可能與社會熱點有關,例如,與新冠疫情相關的項目,與學生畢業求職相關的項目等等。發現這些項目以及解釋這些項目在短期內受到大量關注的原因是很有意義的。因此,本部分“每月之星”列舉了在 2020 年每個月里受到開發者大量關注的項目。以下是我們挑選出來的項目,具體介紹可以參見報告全文內容:

        1月:microsoft/playwright

        2月:wuhan2020/wuhan2020

        3月:CSSEGISandData/COVID-19

        4月:labuladong/fucking-algorithm

        5月:design-resources-for-developers

        6月:CnC_Remastered_Collection

        7月:JaidedAI/EasyOCR

        8月:geekxh/hello-algorithm

        9月:cli/cli

        10月:developer-roadmap

        11月:ytdl-org/youtube-dl

        12月:beurtschipper/Depix

        六、總結與展望

        《GitHub 2020 數字洞察報告》作為一個數據驅動的可視化工具,主要為大家提供一個新的視角來觀察今天的開源世界,進而結合各自的行業經驗獲得洞見。從本次年報開始,我們將這個作品也作為一個開源項目進行運營,逐漸縮短發布的周期,甚至按需提供個性化的按需服務。

        如若發現數據錯誤或遺漏,歡迎提交 Issue 或 PR 到項目的 GitHub 倉庫,本報告文本部分采用 CC-BY-4.0 許可協議。具體請參見完整報告內容。

        七、致謝

        《GitHub 2020 數字洞察報告》是由 X-lab 開放實驗室發起,由“源光閃爍”開源科技媒體策劃,聯合了華東師范大學數據科學與工程學院、開源社、上海開源信息技術協會、開源社會工程研究院(籌)等多家科研機構與開源社區所共同完成。

        在春節期間從零開始,完全通過線上遠程協作的方式,在十天內協作完成了報告的全部內容,并由來自美國和歐洲的顧問專家提出意見與建議。

        本次數字洞察報告的主要貢獻者包括:趙生宇、王偉、周添一、翁振杰、王皓月、夏小雅、朱香寧、楊鳴、寧澤欣、林海銘、王福政、史經犇、婁澤華、顧業鳴、李思穎等,特別感謝吳雪(雪哥)和 Kate(楊佳)作為項目顧問,為數字洞察報告提供指導與建議。

        我們歡迎更多的開源愛好人士加入我們,共同推動開源在世界的發展。

        完整的報告內容,請點擊“傳送門”獲取,或通過以下鏈接獲?。?a rel="nofollow">http://oss.x-lab.info/github-...

        閱讀 2.2k

        SegmentFault 行業快訊
        第一時間為開發者提供行業相關的實時熱點資訊

        讓我們陷入困境的不是無知,而是看似正確的謬誤論斷。思考、否定、再思考,出家人不打誑語,撰文者不說空話。

        2.7k 聲望
        6.2k 粉絲
        0 條評論

        讓我們陷入困境的不是無知,而是看似正確的謬誤論斷。思考、否定、再思考,出家人不打誑語,撰文者不說空話。

        2.7k 聲望
        6.2k 粉絲
        宣傳欄
        一本到在线是免费观看_亚洲2020天天堂在线观看_国产欧美亚洲精品第一页_最好看的2018中文字幕