W3C 發布中文排版規范

jopen 9年前發布 | 26K 次閱讀 W3C

W3C 發布中文排版規范

瀏覽中文網站的時候,心情往往不會太好,擠在一起的字,忽閃忽閃的小動畫,無處不在的鏈接,影響著閱讀體驗。就“排版”這件事情而言,無論紙質書,還是中文網絡,都遠遠落后于同樣書寫方塊字的日本、韓國。

CatchChat 的 CEO 周楷雯此前跟我感嘆網絡上,中文排版規范的缺失。此前他內測新作品,縱版日記 App “小記”,在開發過程發現找不到相關的標準可以參考,結果只好先參考了日文的網絡排版規范。

不過,今天早上有名的關于文字設計和視覺文化的網站 Type is Beautiful 發了一條微博說,“W3C‘中文排版規范草稿出爐’。編輯包括特邀專家董福興、陳奕鈞、梁海。”

W3C 是 1994 年由“萬維網之父”蒂姆·伯納斯-李發起,于麻省理工學院計算機科學實驗室成立,是 技術領域最具權威和影響力的國際中立性技術標準機。由它所制定的 HTML、XML、CSS 等等。根據 W3C 中國官網,2006 年 W3C 也正式來到中國,在北京航空航天大學成立辦事處,推動新興 Web 標準在國內的推廣、應用。——由 W3C 撰寫的《中文排版規范(草稿)》,是中文互聯網世界對中文網頁排版的權威參考標準。

這份《規范》著重解決中文網絡排版的那些不夠標準的問題?可以參考 W3C 的《在 Web 和數字出版中優化文字排版》文檔:

  • 分別文字和詞語的邊界;
  • 斷行;
  • 斷字;
  • 對齊和定位;
  • 源代碼格式的空格和縮進;
  • 字母轉換;
  • 字母空格;
  • 段落特性;
  • 首字母樣式;
  • 雙向文字;
  • 基準線;
  • 豎排文字;
  • 豎排文字和橫排文字混排;
  • Ruby 標音;
  • Line Decoration;
  • 著重標記;
  • 字體;
  • 計數器,列表,等等;
  • 筆記,腳注,等等;
  • 頁碼,頁眉,等等;
  • 頁面布局;
  • 其它“文化-規范”問題。
  • </ul>

    中文排版問題可能要比上述所表明的問題更加復雜。由于歷史發展原因,中文被分成繁體(在港臺地區又稱正體)、簡體兩種書寫規范,標點符號規范也分為兩套,而中國大陸以外的地區還保持豎版排版的古風,若要用一套標準全部兼容,這的確是浩繁的工程。

    根據 W3C 中國成員吳小倩在“HTML5 中文興趣小組”的郵件列表所發布的郵件,W3C 中文排版規范(草稿)的撰寫時間將近一年時間。

    W3C 發布中文排版規范

    而根據吳小倩發送的“中文排版規范編寫計劃和進展”郵件可 知,W3C 中文排版規范(草稿)由 2014 年 3 月 5 日開始編撰。根據郵件內容“過去幾個月中,我們非常榮幸邀請到以下的專業人士參與這份規范的編寫”,可見《規范》從籌備到出爐,耗時或者長達一年半。該郵 件還表明,W3C 中文排版規范是通過 GitHub 寫作,共同撰寫完成。

    特邀專家董福興是臺灣“汪達數位出版所”的創始人,臺灣數字出版的先鋒人物。2014 年 9 月 21 日,他在個人博客上發表了一篇題為《如果你在乎中文》 的文章,闡述中文網頁排版當下所遭遇的問題,以及向網友募捐,籌集資金前往美國加州 Santa Clara 參加 W3C 的年度專家大會 TPAC 2014,以及由 Internet Archive 舉辦的“Books in Browser”研討會,繼續跟進“中文排版規范”的進度,以及通過實際交流的方式,解決中文在網頁排版上遭遇的技術困難。

    陳奕鈞的公開資料不多,他開發了名為“漢字標準格式, 一個提供漢字網頁排版框架,支持各種印刷效果包括相鄰文字裝飾線跳脫、漢字標音、著重號、標點符號修正、中英文混排間隙、漢字擠壓以及章節調整。根據 GitHub 上的提交記錄,最新修改在 2015 年 3 月 26 日。梁海是知乎上的名人,在字體排印的專題下貢獻了許多高質量的回答,他也參與了這次《規范》的撰寫。

    W3C 的《中文排版規范》對于中文網絡世界有著重要的意義。它可為將來的創業者、產品開發人員提供一份權威性的參考性文件,保證中文網頁、中文 App 基本的美感。

    然而,不代表 W3C 出具一份《中文排版規范》,中文互聯網世界的排版水平就有所提升。與霍炬一同幫助重建 FT 中文網系統,以及幫助紐約時報中文版設計了數據和信息架構設計師西喬說,“國內(中文排版)情況糟糕主要是因為對這事不在乎。”大陸地區無論是產品開發 者,還是產品使用者,多年來對“排版規范”的無視,才是中文網頁、中文 App 排版質量糟糕的根本原因。

    不過,隨著中國互聯網、移動互聯網產業競爭日益激烈,大眾審美意識的增強,產品設計將越來越受重視——這其中就包括了影響基礎閱讀體驗的中文網絡排 版。國內不少人都注意到這個問題,不約而同開發了相對應的漢字網頁排版框架。除了陳奕鈞開發的外,包括業內有名的前端開發者 Sofish 開發 Typo.css,另一前端工程師 MZhou 開發的 Entry.css,均為靈活、遵循中文排版規范,兼顧閱讀體驗的中文樣式庫。

    除此之外,越來越多網站注重中文排版的視覺效果,簡書是其中一例,中文排版美觀、大方,閱讀體驗上佳。創始人林立本身十分注重排版的體驗,曾在《我對深度閱讀、專注寫作和自出版的看法》(鏈接已失效)寫道:

    我們精心設計了這個頁面所選用的字體,以及各種格式的排版。很多人問我,為什么簡書的正文選用了宋體,標題選用了楷體?確實,中文互聯網中的主流字體是黑體系,但黑體系是偏現代氣息的,而宋體和楷體是具有古老的文化氣息的,更顯優雅,所以簡書采用了宋體和楷體而不是黑體。

    </blockquote>

    另外也不得不提 Type is Beautiful,這大概是國內第一個專注介紹中英文字體、排版知識的網站,網站本身的排版足以成為中文其它網站的教科書。

    實際上,從林立的回復來看,中文網頁排版的美觀與否,與中文字體有很大的關系。西喬說,“我覺得(中文網絡排版)的平靜是缺少足夠的中文 WebFont。英文的字體已經有上百種了,算上變體有近千種選擇。所以(英文網頁)表現上完全沒有限制,即使最簡潔的設計,單通過字體的組合已經能夠表 現得很好的層次感和設計理念。中文的話,除非花點代價嵌入字體,不然基本是沒什么選擇。”

    WebFont “是一種讓網站能夠使用更多字體的云服務,當訪問調用了此服務的網站時,瀏覽器會自動在后臺下載相應的字體并顯示到網站上,使網站的設計可以不再局限于乏味的系統預裝字體。”

    以中文 WebFont 來看,較為成熟商業化運作的項目,有臺灣的 JustFont,只可惜它在大陸之外。
    回過頭來,W3C《中文排版規范》的出爐對于互聯網業界始終是一件意義深遠的事情,這是中文網絡排版從 0 到 1 的跨越,而從 1 到 100,則看后來者的努力了。


    補充:以下是陳奕鈞對愛范兒的回復,引用部分為提問

    W3C 《中文排版規范》是從何時開始起草,誰是主要推動者?

    </blockquote>

    《中文排版規范》從去年三月開始,由 W3C 的吳小倩負責組織,找來了各路的排版專家及開發瀏覽器的程序員共同討論,確立了方向后便在 Hackpad 上開設帳號,用共筆的方式討論、撰寫正文,最后才收入GitHub專案中管理。很感謝 Hackpad 這個強大的工具,讓分散各地的我們都能無時差地共同編輯,實時看到彼此熒幕上的修改,避免了許多重覆的工作。

    繁體中文的部分源自董福興的《tCLReq》(說是繁體中文,其實整個《中文排版規范》都是“fork”自這分作品),因為某些原因無法作為標準在臺灣推行,董福興便放棄了版權,將其提交給 W3C,成了 CLReq 最初的架構。

    你覺得 W3C 《中文排版規范》主要解決中文網絡排版的什么問題?

    </blockquote>

    這里的“網絡”應該改作“萬維網”,這才是W3C組織主要管理的核心。

    實務上,這分文件暫時應該解決不了什么問題。它主要的目的,是將過去出版社里的美編及排版師傅“口頭”傳授的、可能是 de facto 的排版規則整理起來,好讓新的入門者能有完整、得以參照的“書面”資料;再來,是讓 HTML、CSS 等技術的標準制定人及瀏覽器開發者們,能透過這分文件知曉中文有什么排版上的需求尚未被滿足,從而改進;最后,讓內容編輯者可以使用一行 CSS 屬性,實現標點擠壓、漢字標注拼音(我們叫它“行間注”)等目前在網頁上還有困難、但印刷品上已使用多年的效果。

    除了網頁、電子郵件外,使用 EPub 格式的電子書最終都能因這分文件受益。當然,任何傳統媒介的排版,如紙書等,都可以參照《中文排版規范》。

    請問一下你的職業是什么?因何而參與到 W3C《中文排版規范》中去?

    </blockquote>

    我過去幾年一直關注網頁及瀏覽器的文字設計(typography)與排版問題,后來開發了漢字網頁排版框架“漢字標準格式”(Han.css),對這個議題算是小有研究,被真正的專家梁海及小倩拉入編輯《中文排版規范》。

    與日文、韓文相比,為何 W3C 的《中文排版規范》直到今年才有草稿出來?

    </blockquote>

    韓文部分我不太清楚,但《日文排版規范》已起草多年,它基于日本相應的國家標準JIS X 4051,這分國家標準最后修訂于 2004 年,W3C 的《日文排版規范》應該也是眾多語言中最早的一分排版相關文件。

    中文方面,如前所述,無論在大陸或臺灣,都沒有相應的國家標準,連參考書目都很少,許多設計師的口頭規則可能都來自日文排版規則(尚在使用漢字的地區中,日本的排版應屬最講究的)。外加中文還有繁、簡二大分支要處理,可能因為這些原因,使得中文的腳步稍慢了些。

    有朋友提過,中文 WebFont 的缺乏是中文網頁缺乏表現的原因,你覺得是不是這樣呢?

    </blockquote>

    我認為扯到中文 Web Font 是言之過早了。各個作業系統上,幾乎都沒什么高質量的中文字體。“全部的西文網頁都用 Helvetica 是設計師太無趣的問題,全部的中文網頁都用中易宋體則是電腦的問題”——我想應該是這個道理。首先應該要求蘋果與微軟等公司在桌面、手機平臺上提供好的中 文字體,并改進字體渲染技術。 Google 與 Adobe 合作開發的 Noto Sans CJK/Source Han Sans 是個好的示范和開始,希望未來會有更多種類的平臺預裝字體讓設計師和使用者來選擇,如宋體、楷體等等。

    PS:關于網頁的中文排版,推薦大家看董福興的這篇《簡單做好中文排版:十項讓長文章更容易閱讀的原則》。

    題圖來自 jonasginter

    原文:http://www.ifanr.com/507006 作者: 陳一斌

     本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
     轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
     本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!