當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

音视频技术开发周刊（第122期）

發(fā)布時間：2024/4/11 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了音视频技术开发周刊（第122期）小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

每周一期，縱覽音視頻技術領域的干貨和新聞投稿：contribute@livevideostack.com。

架構

PSA: WebRTC M79 發(fā)布

更改統(tǒng)計信息方式并為 mDNS 增加企業(yè)級策略控制。

IP 攝像頭直播視頻流: RTSP 轉 WebRTC

Red5 Pro 介紹了他們的 Restreamer 插件。

運用機器學習技術的免費嬰兒監(jiān)測系統(tǒng)，且能夠保障數(shù)據(jù)傳輸安全

該方案使用了 WebRTC 技術，能在檢測到嬰兒哭聲的同時過濾掉周圍所有其他噪音。

新浪微博：大規(guī)模離線視頻處理系統(tǒng)的架構設計

微博視頻平臺在4億月活用戶吃瓜嗨聊的高并發(fā)、大流量背景下，既要保證用戶微博生產(chǎn)和消費體驗，又要支持業(yè)務快速迭代，確保正確性、穩(wěn)定性和高可用性。本次演將以微博視頻大規(guī)模視頻離線處理系統(tǒng)的架構設計為主題為大家?guī)泶笠?guī)模分布式系統(tǒng)的架構設計，性能優(yōu)化和高可用保障等一線實戰(zhàn)經(jīng)驗。

傳輸網(wǎng)絡

基于IP的媒體直播協(xié)議

本文來自VSF.tv 2019年十月的演講，演講者是來自Telecompro.tv的Wes Simpson和來自Q3 Media的Ed Calverley. 本次演講的主要內容是關于現(xiàn)代IP音視頻網(wǎng)絡的關鍵技術，ST2110, AES67, PTP和NMOS，以及它們是如何共同作用以實現(xiàn)全IP直播的。

在通信約束下從樣本中學習分布

演講者在本文中介紹了不同的通信協(xié)議，首先是獨立協(xié)議，也就是每個節(jié)點單獨決定如何編碼產(chǎn)生這k比特，所以這些每個節(jié)點的信息都是獨立的隨機變量，這也是獨立協(xié)議名字的由來。第二種是順序協(xié)議，這種協(xié)議下節(jié)點可以進行一定程度上的交互。

各種TCP擁塞控制算法

自從TCP擁塞控制的概念提出以來，TCP擁塞控制算法經(jīng)歷了一系列的演化。這里根據(jù)網(wǎng)上的資料大致總結一下各個TCP擁塞控制算法。

編解碼

淺析視頻編解碼技術的發(fā)展歷程和未來趨勢

視覺是人類獲取信息的主要途徑，圖像與視頻在人與計算機的交互過程中扮演著重要的角色。進入21世紀以后，人們面臨的是一個高速發(fā)展的信息化社會。數(shù)字化后的信息，尤其是數(shù)字化后的圖像和視頻信息具有數(shù)據(jù)海量性的特征，給數(shù)據(jù)存儲和傳輸造成了非常大的困難。基于現(xiàn)有的音視頻壓縮技術的不足，研究和開發(fā)新型有效的多媒體數(shù)據(jù)壓縮編解碼技術，以壓縮的形式存儲和傳輸這些數(shù)據(jù)刻不容緩。

SPRING—用于FASTQ數(shù)據(jù)的下一代壓縮器

本文是來自Stanford Compression Workshop 2019的演講，作者是來自斯坦福大學的博士畢業(yè)生，Shubham Chandak，他致力于基因組數(shù)據(jù)壓縮和DNA存儲方面的研究。本次演講主要講述了用于FASTQ數(shù)據(jù)的新一代壓縮器SPRING。

視頻技術

為您的 Squarespace 網(wǎng)站添加音視頻錄制功能?

我們需要更多這樣的能與網(wǎng)站建設者進行集成的功能。

既讓VR模糊后，Facebook：這次我們讓VR更清晰

近期Facebook Reality Labs再次公布了一項新的VR/AR視頻成像相關技術：DeepFovea。簡單來講，這是一個基于AI的注視點渲染方案，它可以通過較為稀疏的像素，來生成高清且逼真的圖像。

基于 Android 的可視頻控制的小車

由聲網(wǎng) Agora 舉辦的首屆AI in RTC 大賽，已在10 月 24 日圓滿落幕。其中，參與創(chuàng)意編程賽道的 100 多支參賽隊伍在 3 個多月里揮灑創(chuàng)意與熱情，帶來了許多用心的項目。我們邀請了獲獎的參賽隊伍們，逐一分享了他們的開發(fā)實踐。buggy 團隊基于 Android 手機、開發(fā)板、傳感組件等，開發(fā)了一個可通過手機遠程控制，支持視頻的小車。

人物專訪

Akamai Martin Hor?i?ka：最新網(wǎng)絡優(yōu)化技術及編程語言分析

在LiveVideoStackCon深圳站開場之前，我們邀請到了Akamai公司的研發(fā)經(jīng)理Martin Hor?i?ka來接受我們的采訪，采訪中Martin向我們分享了他早期關于UNIX相關的OS、網(wǎng)絡和開發(fā)的工作以及對于近幾年編程語言發(fā)展的看法。除此之外Martin還提供了關于multi-connection和P2P的一些技巧，最后，Martin還談到了Akamai最近的項目在基于UDP的安全傳輸協(xié)議做一些優(yōu)化。

張賢國：視頻壓縮還遠沒有達到最優(yōu)

正如張賢國所說，V265在MSU視頻編碼大賽取得成績的背后是騰訊內部多團隊合作的結果。在視頻編碼優(yōu)化這條路上還有許多工作要做，團隊合作就變得格外重要。本文是MSU2019視頻編碼大賽系列解讀的第一篇。

唐敏豪：我給MSU評測打9分

在唐敏豪看來，MSU視頻編碼大賽是目前業(yè)界規(guī)模最大的編碼器客觀評比平臺，對視頻編碼器的開發(fā)者和使用者都有很高的參考價值，但MSU的評測對于特定的業(yè)務場景不具有絕對的參考價值。

AI智能

NeurlPS 2019 | 曠視研究院推出可學習的樹狀濾波器，實現(xiàn)保留結構信息的特征變換

在圖像語義分割任務中，學習到有足夠判別力度的全局特征十分重要。現(xiàn)有大部分方法要么采用堆疊多層局部卷積層，要么使用非局部的block來獲取遠距離特征之間的語境。然而，由于這些方法都缺乏對空間結構信息的有效保留，在增大感受野的同時忽略了物體結構的具體信息。因此，在本文中，曠視研究院團隊提出了一個可學習的樹狀濾波器，它能夠在建模遠距離語境關系時依然保留細節(jié)信息。

深度學習在圖像處理的應用一覽

計算機視覺的底層，圖像處理，根本上講是基于一定假設條件下的信號重建。這個重建不是3-D結構重建，是指恢復信號的原始信息，比如去噪聲。這本身是一個逆問題，所以沒有約束或者假設條件是無解的，比如去噪最常見的假設就是高斯噪聲。

圖像

快速上手網(wǎng)易云音樂可視化

音頻可視化，顧名思義，就是通過獲取音頻的波形、頻率和其他來自音頻的數(shù)據(jù)轉換成圖像，再到屏幕上顯示出來。通過它，我們能夠制作一些炫酷的前端音樂界面。

資源推薦

Flutter實戰(zhàn)

一個基于 Flutter 的個人項目

活動推薦

硬派多媒體技術方案沙龍·2019深圳

從WebRTC、低延遲直播到邊緣計算，從編解碼Codec到AI加速，從全景視頻到沉浸式音頻，從5G到超高清，從金融、教育、制造等行業(yè)應用場景優(yōu)化到QoE用戶體驗......硬派多媒體技術方案沙龍（Impact of Multimedia Technology Solution Meetup）旨在甄選技術領先、成熟的方案與案例，推動技術傳播，連接多媒體技術生態(tài)上下游。

Xilinx視頻加速技術專場

從AI到編碼、轉碼，硬件加速方案正在扮演越來越重要的角色。本專題，將展現(xiàn)基于FPGA的硬件加速特性，在視頻、圖片編碼與轉碼以及AI計算方面帶來的收益。

點擊“閱讀原文”可查看更多詳細信息，請大家科學上網(wǎng)。

總結

以上是生活随笔為你收集整理的音视频技术开发周刊（第122期）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Zoe Liu：传统算法与深度学习各有所
下一篇： LiveVideoStackCon深圳-