【新智元導讀】剛剛過去的7月,在Github上有哪些最熱門的AI項目?熱心網友按照星星數量搞了個排名,野榜,排著玩的。
上一波榜單是根據推特點贊、轉發和Github星數排序的,但有網友吐槽說推特點贊數可以機刷,另外推特點贊用戶不一定懂研究。
GitHub是一個分布式托管代碼云服務提供商,幫助開發者管理軟件開發以及發現已有代碼。
這次,作者@bycloudai吸取經驗,這次的指標不用推特點贊數了,改成了Github上的星數。
雖然這次的指標也算不上有多專業吧,但比起推特,能逛Github的多少可以認為和AI研究關系更密切。
另外,作者在榜單開頭也明確說了,這個榜屬于自己沒事排來玩玩的野榜,僅供娛樂。
話雖這么說,此次的「續集榜單」基本仍保持上期風格,對Top10分別給出資源庫地址、論文鏈接、題目、作者和發文單位。
來看看這次「改良版」七月最火AI研究都有哪些研究上榜~
Top1:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
作者:Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
摘要:YOLOv7在5FPS到160FPS范圍內的速度和精度都超過了所有已知的物體檢測器,并且在 GPU V100上所有高于30FPS的實時物體檢測器中具有最高的精度56.8%AP。YOLOv7-E6 目標檢測器 (56 FPS V100, 55.9%AP) 比基于Transformer的檢測器 SWIN-L Cascade-Mask R-CNN (9.2 FPS A100, 53.9% AP) 的速度和精度分別高出了509%和2%。
值得一提的是,這篇論文的一作Chien-Yao wang(王建堯)是哥大的一名機器工程方向的研究生,現在是Intel的一名Chrome軟件工程師。
Top2:Text-Guided Synthesis of Artistic Images with Retrieval-Augmented Diffusion Models
作者:Robin Rombach, Andreas Blattmann, and Bjorn Ommer
機構:路德維希-馬克西米利安-慕尼黑大學(Ludwig-Maximilians-Universität München)
摘要:新的架構最近改進了生成圖像合成,從而在各種任務中實現了出色的視覺質量。尤其值得注意的是「AI-Art」領域。通過結合語音和圖像合成模型,建立了所謂的“提示工程”,其中使用精心挑選和組合的句子來在合成圖像中實現一定的視覺風格。
本文提出了一種基于檢索增強擴散模型 (RDM) 的替代方法。在RDM中,在每個訓練實例的訓練期間從外部數據庫中檢索一組最近鄰,并且擴散模型以這些信息樣本為條件。
NUWA-Infinity: Autoregressive over AutoregressiveGeneration for Infinite Visual Synthesis
機構:微軟亞洲研究院、北京大學、微軟Azure AI
排在第三位的是此前備受關注的全華班AI大作NUWA INFINITY。
4、Training Transformers Together(1K星)
作者:Alexander Borzunov,Max Ryabinin,Tim Dettmers等
5、Theseus:A Library for Differentiable Nonlinear Optimization(791星)
作者:Luis Pineda,Taosha Fan,Maurizio Monge
機構:Meta AI,Reality Labs Research
6、k-means Mask Transformer(704星)
資源庫:https://github.com/google-research/deeplab2
論文:https://arxiv.org/abs/2207.04044v1
7、XMem: Long-Term Video Object Segmentation with an Atkinson-Shiffrin Memory Model (699星)
資源庫:https://github.com/hkchengrex/XMem
論文:https://arxiv.org/abs/2207.07115v2
8、TinyViT: Fast Pretraining Distillation for Small Vision Transformers(656星)
資源庫:https://github.com/microsoft/cream
論文:https://arxiv.org/abs/2207.10666v1
9、Towards Grand Unification of Object Tracking (644星)
發文單位:大連理工大學、字節跳動、香港大學、鵬程實驗室
資源庫:ttps://github.com/masterbin-iiau/unicorn
論文:https://arxiv.org/abs/2207.07078v3
10、Multiface: A Dataset for Neural Face Rendering(337星)
資源庫:https://github.com/facebookresearch/multiface
論文:https://arxiv.org/abs/2207.11243v1
https://www.reddit.com/r/MachineLearning/comments/wi05tg/d_most_popular_ai_research_july_2022_pt_2_ranked/