Android高效計算——RenderScript(一)

JulietU40 8年前發布 | 41K 次閱讀 Android開發 移動開發 RenderScript

高效計算—— RenderScript

RenderScript是安卓平臺上很受谷歌推薦的一個高效計算平臺,它能夠自動把計算任務分配到各個可用的計算核心上,包括CPU,GPU以及DSP等,提供十分高效的并行計算能力。可能是由于應用開發時的需求不夠,關于RenderScript的相關文章很少,剛好我在工作中應用到此平臺,做了一些筆記,因此決定整理成博文分享給大家。內容主要來源于官方文檔、StackOverflow以及自己的理解,如有錯誤,請大家指正。本篇主要介紹RenderScript的基本概念。

1 RenderScript 簡介

RenderScript是安卓提供的一個高效計算平臺。它顯著的特點在于:

  1. 能夠自動利用各種核心,包括CPU,GPU以及DSP等,來進行并行計算,能大大提高在圖片處理、數學模型等領域提供高效的計算能力;
  2. 不需要針對不同的核心平臺而編寫不同的代碼,因為RenderScript是在設備上進行運行時編譯的。

早期的RenderScript中包含實驗性的圖形引擎組建,但是從4.1開始就已經被廢除。

使用了RenderScript的應用與一般的安卓應用在代碼編寫上與并沒有太大區別。使用了RenderScript的應用依然像傳統應用一樣運行在VM中,但是你需要給你的應用編寫你所需要的RenderScript代碼,且這部分代碼運行在native層。

RenderScript采用從屬控制架構:底層RenderScript被運行在虛擬機中的上層安卓系統所控制。安卓VM負責所有內存管理并把它分配給RenderScript的內存綁定到RenderScript運行時,所以RenderScript代碼能夠訪問這些內存。安卓框架對RenderScript進行異步調用,每個調用都放在消息隊列中,并且會被盡快處理。

RenderScript工作流程需要經歷三層:

  1. RenderScript運行時API :提供進行運算的API
  2. 反射層 :相當于NDK中的JNI膠水代碼,它是一些由安卓編譯工具自動生成的類,對你寫的RenderScript代碼進行包裝,使得安卓層能夠和RenderScript進行交互
  3. 安卓框架 :通過調用反射層來訪問RenderScript運行時

RenderScript的主要優點:

  1. 可移植性:對于不同架構,不同的處理器都不需要考慮代碼的差異化,因為都是運行時在設備上進行編譯的;
  2. 高性能:提供充分利用所有核心的無縫的并行化計算
  3. 易用性:簡化編碼,不需要像JNI一樣寫膠水代碼

缺點:

  1. 開發復雜:需要去學習新的api
  2. 調試可見性:因為RenderScript可能運行在除了主cpu之外的處理器上,所以調試困難  

2   使用 RenderScript

使用RenderScript需要對編譯或者開發環境進行一定的配置。

使用RenderScript主要分為兩個步驟:編寫.rs文件以及在Android framework中使用RenderScript,下面分別介紹。

2.1 環境配置

  • RenderScript的API可以有兩種來源方式:

對于Android 3.0 (API level 11)及以上的可以在android.renderscript包中獲取

通過android.support.v8.renderscript包獲取,可以支持API level 8及以上的平臺,官方強烈建議使用此支持包的方式來獲取API

  • 編譯環境要求:

Android SDK Tools revision 需要22.2及以上

Android SDK Build-tools revision 需要18.1.0及以上

  • 在project.properties文件中寫入如下屬性:
renderscript.target=18

renderscript.support.mode=true

或者在AS中的build.gradle的defaultConfig中添加

    renderscriptTargetApi 18

    renderscriptSupportModeEnabled true

注意:target的值應該為11及以上,但推薦使用18.如果在Manifest中配置的minSDK的值與target的值不相同,那么在編譯的時候,將使用target的值替代Mainfest中的minSDK值。

2.2  編寫 RenderScript 文件

RenderScript代碼放在.rs或者.rsh文件中,在RenderScript代碼中包含計算邏輯以及聲明所有必須的變量和指針,通常一個.rs文件包含如下幾個部分:

  • 編譯聲明:#pragma rs java_package_name(package.name),比如#pragma rs java_package_name (com.willhua.RenderScript),用來聲明本rs所在的java包。注意:.rs文件只能在應用程序包中,而不能在library項目中。
  • 編譯聲明:#pragma version(1).聲明RenderScript版本,現在都是1
  • 主工作函數root().它會被RenderScript層的reForEach函數調用,實現多處理器對root工作的并行處理。Root函數必須返回void以及接受如下參數

1.分配給RenderScript的輸入輸出地址的指針。在Android3.2以及更低版本中,輸入輸出的指針都需要,在Android4.0及以后的版本中,給出其中一個或者兩個都可以

  •     2.下面兩個參數是可選的,但是只要用了其中一個就必須兩個都提供

a)   指向用戶數據的指針。該數據會在RenderScript的計算中用到。該數據可以指向原始類型或者復雜結構類型

b)   用戶數據的大小

從官方文檔來看,老版本的文檔中有介紹root,而新版本的則用kernel替代。官方在弱化root函數的概念,而是推薦使用kernel概念。本質上來說,root僅僅是一個寫法形式上特殊的kernel而已。

  • 可選init()函數。可以用來做任何初始化工作,比如初始化變量。它將會在每次RenderScript啟動的時候,在其他任何代碼之前執行一次
  • 一些invokable函數。這些函數都是單線程函數(kernel函數的工作則是并行工作的),你可以給這些函數傳遞任意數量的參數。這些函數將會在反射層中生成對應的版本,可以從Android framework中調用。這些函數一般用來做一些初始化工作或者當做計算任務中的一個串行計算單元任務。注意:invokable函數不能是static的。
  • 一些計算內核(compute kernel)。計算內核是并行執行的,它將并行處理輸入Allocation中的每一個Element。一個簡單的compute kernel如下:
                uchar4 __attribute__((kernel)) invert(uchar4 in, uint32_t x, uint32_t y) {
                          uchar4 out = in;
                          out.r = 255 - in.r;
                          out.g = 255 - in.g;
                          out.b = 255 - in.b;
                          return out;
                }

compute kernel基本與一個C函數一樣,但是有如下特征:

a)   __attribute__((kernel))標志。該標志表示該函數是一個RenderScript kernel函數,而不是一個invokable函數

b)   in參數及其類型。在RenderScript kernel中,這個參數將會基于傳給kernel的輸入Allocation而自動賦值,且默認情況下,對于Allocation中每一個Element都將會執行一遍kernel函數

c)   返回值及其類型。每次kernel函數執行的返回值將會自動寫入到輸出Allocation的正確位置。RenderScript將會對輸入輸出Allocation進行檢查,如果他們與kernel函數聲明不匹配則將拋出異常。

每個kernel都應該有一個輸入Allocation或者一個輸出Allocation或者二者都有,但不能有兩個及以上的輸入或者輸出Allocation。如果需要在kernel中訪問多個輸入或者輸出,則需要聲明rs_allocation全局變量來擔任多余一個的輸入或者輸出角色,然后再kernel函數或者invokable函數中通過rsGetElementAt_ type ()或者rsSetElementAt_ type ()來訪問或者設置相應的Allocation,其中type為對應Allocation的Element類型對應的數據類型,比如uchar4。

在kernel中,可以通過可選的xyz參數來獲取當前Element在整個Allocation中的坐標值,比如上面的invert中就通過xy來獲取了xy坐標值。注意xyz的參數名不能設置為其他名稱,且類型必須為uint32_t。

  • 任何要在RenderScript中用到的變量,指針以及結構。這些聲明也可以在.rsh文件中
  • 所需要的script變量。就和C中的全局變量一樣,這些全局變量一般用來傳遞參數給計算kernel。
  • 一些靜態變量以及函數。靜態的變量與普通全局變量的區別在于:靜態變量不會在映射在反射層,也即無法從Android framework中調用;靜態函數就是一個標準的C函數,但是不會映射到反射層,也無法從Android framework中調用,但是可以在RenderScript中的kernel或者invokable中調用。如果有變量或者函數需要在RenderScript中使用但是不需要在Java中使用,強烈推薦設置為static的。
  • 可選的精度控制配置,主要有三個等級:

a)   #pragma rs_fp_full:默認的等級。表示的完全遵守IEEE 754-2008 standard的精度要求

b)   #pragma rs_fp_relaxed:不嚴格的IEEE 754-2008 standard的精度要求

c)   #pragma rs_fp_imprecise:比relaxed更低的精度要求

對于大部分應用來說,使用relaxed精度要求都可以滿足要求而無任何副作用

2.3 Android framework 層調用 RenderScript

雖然各個應用使用RenderScript細節各不相同,但大體有著這樣的模式:

  1. 初始化RenderScript context 。通過RenderScript.create函數可以創建相應的context,有了該context才可以進行RenderScript的其他動作,并通過該context可以控制其他RenderScript對象的生命周期。因為context的創建需要在不同的硬件設備上創建資源,所以可能會比較耗時。因此,最好不要讓context的創建在響應速度要求比較高的時間點上。一般來說,一個應用應該只有一個context。
  2. 至少需要創建一個Allocation 。用的比較多的方法是createTyped(RenderScript, Type) 或createFromBitmap(RenderScript, Bitmap)。
  3. 創建需要的scripts 。可以分為兩種,一種就是通過自定義.rs文件,然后在反射層自動生成的ScriptC子類,名字為ScriptC_rsfilename;還有一種就是系統定義的一些scripts,比如高斯模糊等,他們都是ScriptIntrinsic的子類。
  4. 給Allocation填充數據 。使用Allocation的copy系類方法
  5. 設置必要的script變量 。在ScriptC_rsfilename會給script變量生成相應的set方法,比如int型名為num的script變量則會在反射層生成set_num(int)方法。
  6. 啟動計算 。.rs中定義的kernel函數都會在反射層的ScriptC_rsfilename類中生成forEach_kernalname方法。該方法的執行是異步的,且會在RenderScript中按照kernel調用順序來執行。前面提到過,forEach_kernalname方法默認對對應Allocation中所有的Element執行計算,但是可以在forEach_kernalname參數的最后傳入一個Scrpit.LunchOptions參數來指定Allocation中需要被計算的子集。.rs中定義的invokable函數則會在反射層生成invoke_functionname的方法,也可以按需調用
  7. 從Allocation中得到數據 。通過Allocation的copyTo系類方法,可以把Allocation中的數據放到Java數據中。這些copyTo方法與forEach方法保持同步,forEach的計算完成之后就會自動啟動copy過程。目前只支持基本類型的copyTo,暫不支持比如自定義的struct等數據。
  8. 釋放資源 。通過RenderScript.destory方法來釋放相關資源。  

2.4 RenderScript 工作流程

最開始就提到,RenderScript是一個主從架構,底層的RenderScript被上層的Android framework所控制。其工作流程也正是如此。從在Android framework創建RenderScript的context開始,然后給RenderScript層分配、綁定相關內存,對script變量進行初始化,然后調用forEach函數通知啟動RenderScript計算。RenderScript將會自動把它的計算任務分配到各個可用的核心上來完成計算任務(現在還只能支持CPU,以后將會支持到GPU以及DSP,且代碼不需要變動)。RenderScript計算完成以后將會自動把計算結果放到相應的Allocation內存,然后在Android framework層再從Allocation中copy出數據,最后Android framework層命令RenderScript釋放資源,流程介紹。下圖展示了RenderScript的工作流程:

 

來自:http://www.cnblogs.com/willhua/p/5778415.html

 

Save

 

 本文由用戶 JulietU40 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!