淺談Thrift內部實現原理

jopen 12年前發布 | 16K 次閱讀 Thrift WEB服務/RPC/SOA

Thrift由兩部分組成：編譯器（在compiler目錄下，采用C++編寫）和服務器（在lib目錄下），其中編譯器的作用是將用戶定義的 thrift文件編譯生成對應語言的代碼，而服務器是事先已經實現好的、可供用戶直接使用的RPC Server（當然，用戶也很容易編寫自己的server）。同大部分編譯器一樣，Thrift編譯器（采用C++語言編寫）也分為詞法分析、語法分析等步驟，Thrift使用了開源的flex和Bison進行詞法語法分析（具體見thrift.ll和thrift.yy），經過語法分析后，Thrift 根據對應語言的模板（在compiler\cpp\src\generate目錄下）生成相應的代碼。對于服務器實現而言，Thrift僅包含比較經典的服務器模型，比如單線程模型（TSimpleServer），線程池模型（TThreadPoolServer）、一個請求一個線程（TThreadedServer）和非阻塞模型(TNonblockingServer)等。本文將以C++為例進行一個實例分析。

假設用戶編寫了以下Thrift文件：

struct LogInfo {

1: required string name,

2: optional string content,

}

service LogSender {

void SendLog(1:list<LogInfo> loglist);

}
</blockquote>

用戶使用命令“thrift –gen cpp example.thrift”可生成C++代碼，該代碼包含以下文件：

example_constants.h

example_constants.cpp

example_types.h //struct定義

example_types.cpp //struct實現

LogSender.h //service定義

LogSender.cpp //service實現和LogSenderClient實現

LogSender_server.skeleton.cpp //一個實例RPC Server
</blockquote>

用戶可以這樣編寫Client：

shared_ptr socket(new TSocket(“8.8.8.8″, 9090));

shared_ptr transport(new TBufferedTransport(socket));

shared_ptr protocol(new TBinaryProtocol(transport));

LogSenderClient client(protocol);

try {

transport->open();

vector<LogInfo> logInfos;

LogInfo logInfo(“image”, “10:9:0 visit:xxxxxx”);

logInfos.push_back(logInfo);

…..

client.SendLog(logInfos);

transport->close();

} catch (TException &tx) {

printf(“ERROR: %s\n”, tx.what());

}
</blockquote>

為了深入分析這段代碼，我們看一下client.SendLog()函數的內部實現（在LogSender.cpp中）：

void LogSenderClient::SendLog(const std::vector<LogInfo> & loglist)

{

send_SendLog(loglist);

recv_SendLog();

}

void LogSenderClient::send_SendLog(const std::vector<LogInfo> & loglist)

{

int32_t cseqid = 0;

oprot_->writeMessageBegin(“SendLog”, ::apache::thrift::protocol::T_CALL, cseqid);

LogSender_SendLog_pargs args;

args.loglist = &loglist;

args.write(oprot_);

oprot_->writeMessageEnd();

oprot_->getTransport()->flush();

oprot_->getTransport()->writeEnd();

}

void LogSenderClient::recv_SendLog()

{

int32_t rseqid = 0;

std::string fname;

::apache::thrift::protocol::TMessageType mtype;

iprot_->readMessageBegin(fname, mtype, rseqid);

if (mtype == ::apache::thrift::protocol::T_EXCEPTION) {

…..

}

if (mtype != ::apache::thrift::protocol::T_REPLY) {

……

}

if (fname.compare(“SendLog”) != 0) {

……

}

LogSender_SendLog_presult result;

result.read(iprot_);

iprot_->readMessageEnd();

iprot_->getTransport()->readEnd();

return;

}
</blockquote>

閱讀上面的代碼，可以看出，RPC函數SendLog()實際上被轉化成了兩個函數：send_SendLog和recv_SendLog，分別用于發送數據和接收結果。數據是以消息的形式表示的，消息頭部是RPC函數名，消息內容是RPC函數的參數。

我們再進一步分析RPC Server端，一個server的編寫方法（在LogSender.cpp中）如下：

shared_ptr protocolFactory(new TBinaryProtocolFactory());

shared_ptr handler(new LogSenderHandler());

shared_ptr processor(new LogSenderProcessor(handler));

shared_ptr serverTransport(new TServerSocket(9090));

shared_ptr transportFactory(new TBufferedTransportFactory());

TSimpleServer server(processor,

serverTransport,

transportFactory,

protocolFactory);

printf(“Starting the server…\n”);

server.serve();
</blockquote>

Server端最重要的類是LogSenderProcessor，它內部有一個映射關系processMap_，保存了所有RPC函數名到函數實現句柄的映射，對于LogSender而言，它只保存了一個RPC映射關系：

processMap_[" SendLog"] = &LogSenderProcessor::process_SendLog;
</blockquote>

其中，process_SendLog是一個函數指針，它的實現如下：

void LogSenderProcessor::process_SendLog(int32_t seqid, ::apache::thrift::protocol::TProtocol* iprot, ::apache::thrift::protocol::TProtocol* oprot)

{

LogSender_SendLog_args args;

args.read(iprot);

iprot->readMessageEnd();

iprot->getTransport()->readEnd();

LogSender_SendLog_result result;

try {

iface_->SendLog(args.loglist);//調用用戶編寫的函數

} catch (const std::exception& e) {

……

}

oprot->writeMessageBegin(“SendLog”, ::apache::thrift::protocol::T_REPLY, seqid);

result.write(oprot);

oprot->writeMessageEnd();

oprot->getTransport()->flush();

oprot->getTransport()->writeEnd();

}
</blockquote>

LogSenderProcessor中一個最重要的函數是process()，它是服務器的主體函數，服務器端（socket server）監聽到客戶端有請求到達后，會檢查消息類型，并檢查processMap_映射，找到對應的消息處理函數，并調用之（注意，這個地方可以采用各種并發模型，比如one-request-one-thread，thread pool等）。

通過上面的分析可以看出，Thrift最重要的組件是編譯器（采用C++編寫），它為用戶生成了網絡通信相關的代碼，從而大大減少了用戶的編碼工作。

本文鏈接地址: http://dongxicheng.org/search-engine/thrift-internals/

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1390096808054.html

Thrift WEB服務/RPC/SOA

淺談Thrift內部實現原理

相關經驗

相關資訊

相關文檔

目錄