早在2016年3月,由谷歌開發(fā)的人工智能機(jī)器人AlphaGo第一次擊敗人類職業(yè)圍棋選手,人工智能驚呆了整個圍棋界,也讓人們開始認(rèn)識到具備“深度學(xué)習(xí)”的人工智能所具有的威力。
2022年11月30日發(fā)布的ChatGPT能夠通過理解和學(xué)習(xí)人類的語言來進(jìn)行對話,還能根據(jù)聊天的上下文進(jìn)行互動,真正像人類一樣與人聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務(wù),并提升內(nèi)容生產(chǎn)效率與豐富度。可以說,以AlphaGo、ChatGPT等為代表的人工智能應(yīng)用在不斷取得突破,并且不斷挑戰(zhàn)人類智慧,不斷取得驚人的進(jìn)展。
近年來,專業(yè)視聽行業(yè)在人工智能(AI)方面有什么作為?做了哪些探索?有什么進(jìn)展?
幾年前,在指揮、控制的信號處理與協(xié)作領(lǐng)域,一些廠商已經(jīng)開始切入人工智能,并開發(fā)出一定水平的手勢互動等初級AI應(yīng)用解決方案。
在政府與企業(yè)的會議領(lǐng)域,會議攝像機(jī)廠商也一直在努力融合人工智能。比如,幾年前,在視頻會議領(lǐng)域,一些廠商開發(fā)出攝像機(jī)的語音跟蹤和定位功能。過去,在政府或企業(yè)的視頻會議中,在不配備專職攝像師的會議環(huán)境中,一般只有一個正面前景畫面或再加上一個背面的全景畫面,一個畫面貫徹始終,沒有動態(tài)感,不僅畫面會出現(xiàn)捕捉不全,還會給人以沉悶感。在配備專職攝像師的大型會議環(huán)境中,演講人的鏡頭跟蹤、人像特寫、半身、全身的變換等都需要由攝像師人工把控。但是,在小型會議中,這種拍攝往往效果并不理想。
另外,配備專職攝像師肯定是更加耗費(fèi)人力和成本的一種解決方案,所以,無論是政府會議還是企業(yè)會議,如何能降低人力成本,還能同時提高影像品質(zhì)呢?索尼具有人工智能分析功能的PTZ智能中心構(gòu)圖攝像機(jī)SRG-A40、SRG-A12 的出現(xiàn),將為您解決這些問題。
2023年1月31日,索尼正式發(fā)布兩款具有人工智能分析功能的PTZ(平移/俯仰/變焦)智能中心構(gòu)圖攝像機(jī)新品SRG-A40與SRG-A12。產(chǎn)品發(fā)布后得到了政府、企業(yè)、教育等很多行業(yè)用戶的關(guān)注。為了更好的帶大家了解這兩款新品,《專業(yè)視聽》(ProAVChina)媒體平臺特別邀請了索尼(中國)有限公司消費(fèi)電子與專業(yè)系統(tǒng)本部影像方案與移動通信市場部副總監(jiān)孫自力先生、高級經(jīng)理賈導(dǎo)先生接受專訪。
Q 索尼SRG-A40、SRG-A12攝像機(jī)的人工智能分析都體現(xiàn)在哪些功能?
孫自力先生:與AlphaGo、ChatGPT等AI系統(tǒng)一樣,這兩款索尼攝像機(jī)也一樣具有深度學(xué)習(xí)能力,使用前只需簡單地把需要被識別的場景信息預(yù)先置入攝像機(jī),之后拍攝時攝像機(jī)就能自動識別場景內(nèi)的拍攝目標(biāo)。
賈導(dǎo)先生:剛推出的兩款攝像機(jī)新品SRG-A40與SRG-A12,其核心是具有人工智能分析功能,通過這個功能,實現(xiàn)智能中心構(gòu)圖效果。SRG-A40與SRG-A12新品支持全身、半身和特寫三種智能構(gòu)圖模式,拍攝時自由度更高。攝像機(jī)在開機(jī)后可即刻自動開始工作,搜索并識別需要跟蹤的目標(biāo)。SRG-A40與SRG-A12具備先進(jìn)的人工智能識別技術(shù),即使佩戴口罩時也可準(zhǔn)確識別被攝者的面部,而提示燈的加入可讓用戶輕松識別正在跟蹤目標(biāo)的攝像機(jī)。
與此同時,它還可自動穩(wěn)定地跟蹤演講者,無論是側(cè)身還是快速移動,即使是在多人畫面中都可以持續(xù)跟蹤認(rèn)定的目標(biāo)或主角,不需要人工干預(yù),F(xiàn)場所以這些功能都由設(shè)備自己完成,不需要傳統(tǒng)的攝像師進(jìn)行任何操作,同時,還根據(jù)畫面表現(xiàn)需要,選擇三種自動構(gòu)圖模式顯示。
Q 索尼SRG-A40與SRG-A12的影像表現(xiàn)如何?
賈導(dǎo)先生:索尼SRG-A40與SRG-A12支持人工智能驅(qū)動的智能中心構(gòu)圖功能,可以快速完成識別和準(zhǔn)確保持構(gòu)圖,即便突然出現(xiàn)人物干擾,也可以牢牢的鎖住演講者圖像。
用索尼SRG-A40和SRG-A12拍攝和直播會議,有些時候甚至可以媲美專業(yè)導(dǎo)播的操作。此外,新品還支持長焦轉(zhuǎn)換和清晰影像變焦技術(shù),并且配置快速云臺和圖像凍結(jié)預(yù)設(shè)功能。
如果認(rèn)為索尼SRG-A40與SRG-A12僅僅因為人工智能而出彩,那就大大低估了兩款新品了。除了人工智能,索尼SRG-A40與SRG-A12出色的畫質(zhì)同樣精彩得讓人羨慕。
據(jù)孫自力先生介紹:SRG-A40與SRG-A12均采用高靈敏度的Exmor R™ CMOS影像傳感器,支持4K 30p和FHD 60p格式,可呈現(xiàn)自然生動且噪點更低的高畫質(zhì)影像。SRG-A40支持清晰影像變焦技術(shù),4K格式時可將變焦從20倍提高至30倍,F(xiàn)HD格式則可增至40倍,而SRG-A12則可支持12倍光學(xué)變焦。在FHD格式長焦轉(zhuǎn)換模式下,SRG-A40可擴(kuò)展至80倍變焦,而SRG-A12則可擴(kuò)展至24倍變焦,多臺設(shè)備之間也可實現(xiàn)平滑快速的PTZ(平移/俯仰/變焦)操控。
Q 人工智能應(yīng)用在索尼攝像機(jī)SRG-A40與SRG-A12上,它的操控優(yōu)勢是什么?
賈導(dǎo)先生:SRG-A40與SRG-A12的設(shè)置和操控也非常簡單。通過圖像設(shè)置文件功能,用戶可以快速設(shè)置和復(fù)制攝像機(jī)之間的菜單設(shè)定,提高系統(tǒng)調(diào)試效率。
Q 目前市場上大多數(shù)攝像機(jī)都具有預(yù)置位調(diào)用功能,索尼攝像機(jī)SRG-A40與SRG-A12的預(yù)置位調(diào)用功能有什么與眾不同之處?
賈導(dǎo)先生:SRG-A40與SRG-A12的PTZ運(yùn)動同步功能可使攝像機(jī)在平移/俯仰/變焦范圍內(nèi)平穩(wěn)快速地移動到目標(biāo)位置。預(yù)置位調(diào)用功能可讓攝像機(jī)快速轉(zhuǎn)換到其他預(yù)置位來捕捉精彩瞬間。在攝影機(jī)移動時,畫面凍結(jié)預(yù)設(shè)功能可以讓畫面固定在最后拍攝的影像,讓與會者不會被模糊的過渡鏡頭而分散注意力。此外,虛擬網(wǎng)絡(luò)攝像機(jī)驅(qū)動程序軟件可讓多達(dá)五個連接的攝像機(jī)轉(zhuǎn)換為協(xié)作會議和演講拍攝工具,從而在視頻會議期間提供專業(yè)的影像質(zhì)量。
除了人工智能分析功能外,SRG-A40與SRG-A12的網(wǎng)絡(luò)鏈接功能也相當(dāng)不俗。
賈導(dǎo)先生: SRG-A40與SRG-A12支持3G-SDI、HDMI和IP連接,并可通過VISCA/VISCA over IP進(jìn)行遠(yuǎn)程控制。SRG-A40與SRG-A12支持PoE++供電標(biāo)準(zhǔn),使用一根網(wǎng)線即可進(jìn)行供電、輸出和控制,簡化了布線需求。憑借豐富的接口和高集成度優(yōu)勢,再配合PTZ控制的靈活變焦和多角度拍攝能力,使新品在工作時不再受限于位置與空間。實時傳輸流協(xié)議 (RTSP) 支持遠(yuǎn)程觀看,而安全可靠傳輸協(xié)議 (SRT) 則可提供安全、流暢和穩(wěn)定的視頻流。
綜上所述,索尼新發(fā)布的兩款攝像機(jī)SRG-A40與SRG-A12以“AI”智能中心構(gòu)圖功能助力智能會議室切入AI時代。4K高畫質(zhì)視頻、多種接口與視頻流格式和強(qiáng)大的變焦以及簡潔的連接與操控,十分適合應(yīng)用于政府、企業(yè)、教育等多種場景。