視障工程師幫助低視力人群掃除資訊障礙

2021.06.22

全球至少有22億人有不同程度的近視或遠視問題。在大多數情況下,視力障礙可以透過輔助工具或治療來矯正,但對不少人來說,視障不僅影響他們的正常生活,也限制了他們的就業選擇。在數字時代,資訊世界的無障礙與現實世界的無障礙同等重要,因此一些工程師致力為視障人群研發適合他們的應用程式。

25歲的周富貴是一名視障人士,也是深圳市資訊無障礙研究會的軟件開發工程師。每次打開電腦,他都需要把鼻尖貼近螢幕,再把字體放大五倍,才能以左眼僅存的視力看到螢幕上小小的英文代碼。

包括富貴在内的許多視障工程師致力於通過科技促進信息無障礙。

富貴16歲時,入讀了一家職業培訓學校學習推拿治療。畢業後開始找工作時,他才發現視障人士想要在職場立足是多麼困難。大部分企業都不了解視障員工的各種技能和他們的特定需求。

富貴堅信他能夠為這個世界貢獻更多價值,於是開始尋找推拿以外的工作。他從小就喜歡數學和邏輯推理,很快,他發現自己對資訊科技,尤其是軟件程式設計充滿興趣。

有一個多月的時間,他一直在網上觀看和收聽軟件開發相關的影片。他將螢幕放大,暫停,仔細查看螢幕上的編碼,然後花大量時間學習程式設計。

沉浸在編碼的世界時,富貴腦海中閃現出一個新的想法:為視障人士開發一款應用,讓他的朋友和其他視障人士能夠像普通人一樣用手機獲取資訊、享受娛樂。

像富貴這樣的低視力人士往往無法閱讀其他人習以爲常的資訊。他說:「超市裏醬油和醋的瓶子很像,你必須要去看那些小字,才能分得清,但在沒有工具的情況下要看清那些小字非常難。」

部分螢幕閱讀器會為用戶提供文字轉語音以外的功能支援,例如光學字元辨識(OCR)便是一種可以掃描螢幕上圖像,並將其轉換成可閱讀的電腦文字的技術。這種技術可以進行圖形介面識別、文字識別、座標識別和紙質資料識別等。

大多數像富貴這樣的普通開發者都無法自行開發這種技術。雲計算供應商正在開發這些能力,並以應用程式設計介面(API)的形式讓其他開發者可以直接調取使用,大大降低了應用開發的門檻。

OCR只提供基礎能力,為充分理解視障人群的需求,開發人員還需要考慮應用程式所提供的整體交互體驗。例如,介面上有很多資訊,應該將哪些讀出來?螢幕閱讀器應該以哪種順序閱讀這些資訊?面對這些問題,富貴開始深入研究資訊無障礙領域的相關知識。

幾個月之後,富貴將幾種視障用戶常用的功能加入一款可供用戶聽小說、查看天氣和瀏覽視障人士論壇的應用程式,並將它命名為「掌中世界」,他的很多朋友已經在用它便利他們的生活。

富貴用手機應用程式收聽資訊。

「掌中世界」發布後,富貴在視障開發者當中開始略有名氣。這款應用程式為他贏得了很多讚譽,也帶來了很多其他機會和項目,大大豐富了他的開發經驗和技術洞察。

2020年,富貴收到深圳市資訊無障礙研究會的錄取通知書,正式成為一名資訊無障礙工程師。這次機會不但改變了他的生活軌跡,還讓他以全新的方式為全球其他視障人士提供幫助。

運用技術為視障人群搭建「資訊公路」

2020年6月,騰訊雲收到一封來自深圳市資訊無障礙研究會的感謝信,感謝其為視障社群帶來的資訊和創造的無障礙環境。

半年前,騰訊雲曾為身障開發群體提供OCR支援。現在,除富貴開發的「掌中世界」外,很多其他應用也具備OCR功能。OCR的請求總量已超過180萬,目前服務的視障用戶逾200萬。

全賴這些技術開發上的進展,視障用戶能夠在網購時「看到」產品詳情頁中的文字內容。此外,他們還能識別出「按鈕」、「驗證碼」和網上活動所需的其他資訊。事實上,北京的一位視障父親通過應用程式對電視螢幕拍照,了解節目表的順序和內容後,成功為孩子播放《粉紅豬小妹》動畫。沒有技術的助力,這些是難以實現的。

現在,富貴有一個更大的夢想。他希望先進的技術能夠在更具體的場景中為視障人群帶來更豐富、更細緻的體驗。例如,當一款應用描述一幅圖片時,它能夠描述出天空的樣子、天空中雲朵的飄移,以及湖水中蕩起的漣漪。

隨著各種互聯網軟件無障礙體驗的不斷提升,視障人士可以獲得越來越多互聯網的內容和資訊,同時也擁有更多選擇來實現他們的價值和潛能。

騰訊努力為開發者提供長久的支持,幫助人們突破自身限制,讓所有人與互聯網實現無障礙連接。