用 Python3 & OpenCV 將視頻轉成字符動畫
在介紹如何用 Python3 & OpenCV 將視頻轉成字符動畫之前,先簡單的介紹一下 OpenCV 吧,畢竟可能很多小伙伴不太了解:
OpenCV是一個基于BSD許可(開源)發行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的接口,實現了圖像處理和計算機視覺方面的很多通用算法。
接著來看看最終的效果圖吧,很可愛又很酷炫;
效果展示
(由于是在線環境,流暢度是不及本地環境的)
播放停止后的效果,注意終端中并無殘留的動畫字符:
說明:
這個項目是 FrostSigh 發表在 實驗樓 上的項目課程;
知識點
通過開發這個項目可以學習到如下的知識點:
- OpenCV 編譯;
- 使用 OpenCV 處理圖片、視頻;
- 圖片轉字符畫原理;
- 守護線程;
- 光標定位轉義編碼;
編譯安裝 OpenCV
本課程的實驗中使用了 OpenCV 3.1,因此我們需要編譯安裝它。
首先我們需要處理一個問題:當前實驗樓的環境中 python3 命令使用的 python 版本為 3.5,但源中沒有 python3.5-dev 的包,這會導致編譯 numpy、OpenCV 出錯,以及可能會出現其它問題。總而言之,我們需要將 python3 命令使用的 python 版本切換為 3.4。
$ sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.4 70 --slave /usr/bin/python3m python3m /usr/bin/python3.4m
然后安裝一些依賴的包:
$ sudo apt-get update
$ sudo apt-get install python3-dev
$ sudo pip3 install numpy
$ sudo apt-get install cmake libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev
現在可以開始編譯 OpenCV 3.1 了,不過這個編譯過程極其耗費時間(2個小時多),我相信各位同學們是沒有耐心等待編譯完成的,所以我在后面提供了編譯后的二進制文件下載鏈接,大家直接使用就可以了。
下面是在實驗樓環境中編譯 OpenCV 3.1 所需的命令,其他環境中的編譯請參考官網: http://docs.opencv.org/master/d7/d9f/tutorial_linux_install.html
$ wget https://github.com/Itseez/opencv/archive/3.1.0.zip
$ unzip 3.1.0.zip && cd opencv-3.1.0/
$ mkdir build && cd build
$ cmake -D CMAKE_BUILD_TYPE=Release \
-D CMAKE_INSTALL_PREFIX=/usr/local \
PYTHON3_EXECUTABLE=/usr/bin/python3 \
PYTHON_INCLUDE_DIR=/usr/include/python3.4 \
PYTHON_LIBRARY=/usr/lib/x86_64-linux-gnu/libpython3.4m.so \
PYTHON3_NUMPY_INCLUDE_DIRS=/usr/local/lib/python3.4/dist-packages/numpy/core/include ..
$ make -j4
不想自己編譯的同學請下載編譯好的二進制文件,然后解壓并進入 opencv-3.1.0/build 目錄:
$ wget http://labfile.oss.aliyuncs.com/courses/637/opencv-3.1.0.tar.gz
$ tar xzvf opencv-3.1.0.tar.gz
$ cd opencv-3.1.0/build
然后我們開始安裝:
$ sudo make install
程序原理
大家應該都明白視頻其實可以看作一系列圖片組成的,因此視頻轉字符動畫最基本的便是圖片轉字符畫。
在這里簡單的說一下圖片轉字符畫的原理:首先將圖片轉為灰度圖,每個像素都只有亮度信息(用 0~255 表示)。然后我們構建一個有限字符集合,其中的每一個字符都與一段亮度范圍對應,我們便可以根據此對應關系以及像素的亮度信息把每一個像素用對應的字符表示,這樣字符畫就形成了。
字符動畫要能播放才有意義。最最簡單粗暴的,用文本編輯器打開字符動畫文本文件,然后狂按 PageDown 鍵就能播放。然而這真的太簡單太粗暴了,一點都不優雅。
我們還是在終端里面播放字符動畫,只需要一幀一幀輸出就能達到動畫的效果了,然而這卻有一個很大的弊端:播放時,你會發現終端右邊的滾動條會越來越小(如果有的話);播放完畢后,在終端中往上翻頁,全是之前輸出的字符畫,播放前的命令歷史全部被擠占掉了。在本實驗后面提供了這個問題的解決辦法。
完整代碼
import sys
import os
import time
import threading
import cv2
import pyprind
class CharFrame:
ascii_char = "$@B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\|()1{}[]?-_+~<>i!lI;:,\"^`'. "
# 像素映射到字符
def pixelToChar(self, luminance):
return self.ascii_char[int(luminance/256*len(self.ascii_char))]
# 將普通幀轉為 ASCII 字符幀
def convert(self, img, limitSize=-1, fill=False, wrap=False):
if limitSize != -1 and (img.shape[0] > limitSize[1] or img.shape[1] > limitSize[0]):
img = cv2.resize(img, limitSize, interpolation=cv2.INTER_AREA)
ascii_frame = ''
blank = ''
if fill:
blank += ' '*(limitSize[0]-img.shape[1])
if wrap:
blank += '\n'
for i in range(img.shape[0]):
for j in range(img.shape[1]):
ascii_frame += self.pixelToChar(img[i,j])
ascii_frame += blank
return ascii_frame
class I2Char(CharFrame):
result = None
def __init__(self, path, limitSize=-1, fill=False, wrap=False):
self.genCharImage(path, limitSize, fill, wrap)
def genCharImage(self, path, limitSize=-1, fill=False, wrap=False):
img = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
if img is None:
return
self.result = self.convert(img, limitSize, fill, wrap)
def show(self, stream = 2):
if self.result is None:
return
if stream == 1 and os.isatty(sys.stdout.fileno()):
self.streamOut = sys.stdout.write
self.streamFlush = sys.stdout.flush
elif stream == 2 and os.isatty(sys.stderr.fileno()):
self.streamOut = sys.stderr.write
self.streamFlush = sys.stderr.flush
elif hasattr(stream, 'write'):
self.streamOut = stream.write
self.streamFlush = stream.flush
self.streamOut(self.result)
self.streamFlush()
self.streamOut('\n')
class V2Char(CharFrame):
charVideo = []
timeInterval = 0.033
def __init__(self, path):
if path.endswith('txt'):
self.load(path)
else:
self.genCharVideo(path)
def genCharVideo(self, filepath):
self.charVideo = []
cap = cv2.VideoCapture(filepath)
self.timeInterval = round(1/cap.get(5), 3)
nf = int(cap.get(7))
print('Generate char video, please wait...')
for i in pyprind.prog_bar(range(nf)):
rawFrame = cv2.cvtColor(cap.read()[1], cv2.COLOR_BGR2GRAY)
frame = self.convert(rawFrame, os.get_terminal_size(), fill=True)
self.charVideo.append(frame)
cap.release()
def export(self, filepath):
if not self.charVideo:
return
with open(filepath,'w') as f:
for frame in self.charVideo:
# 加一個換行符用以分隔每一幀
f.write(frame + '\n')
def load(self, filepath):
self.charVideo = []
# 一行即為一幀
for i in open(filepath):
self.charVideo.append(i[:-1])
def play(self, stream = 1):
# Bug:
# 光標定位轉義編碼不兼容 Windows
if not self.charVideo:
return
if stream == 1 and os.isatty(sys.stdout.fileno()):
self.streamOut = sys.stdout.write
self.streamFlush = sys.stdout.flush
elif stream == 2 and os.isatty(sys.stderr.fileno()):
self.streamOut = sys.stderr.write
self.streamFlush = sys.stderr.flush
elif hasattr(stream, 'write'):
self.streamOut = stream.write
self.streamFlush = stream.flush
breakflag = False
def getChar():
nonlocal breakflag
try:
# 若系統為 windows 則直接調用 msvcrt.getch()
import msvcrt
except ImportError:
import termios, tty
# 獲得標準輸入的文件描述符
fd = sys.stdin.fileno()
# 保存標準輸入的屬性
old_settings = termios.tcgetattr(fd)
try:
# 設置標準輸入為原始模式
tty.setraw(sys.stdin.fileno())
# 讀取一個字符
ch = sys.stdin.read(1)
finally:
# 恢復標準輸入為原來的屬性
termios.tcsetattr(fd, termios.TCSADRAIN, old_settings)
if ch:
breakflag = True
else:
if msvcrt.getch():
breakflag = True
# 創建線程
getchar = threading.Thread(target=getChar)
# 設置為守護線程
getchar.daemon = True
# 啟動守護線程
getchar.start()
# 輸出的字符畫行數
rows = len(self.charVideo[0])//os.get_terminal_size()[0]
for frame in self.charVideo:
# 接收到輸入則退出循環
if breakflag:
break
self.streamOut(frame)
self.streamFlush()
time.sleep(self.timeInterval)
# 共 rows 行,光標上移 rows-1 行回到開始處
self.streamOut('\033[{}A\r'.format(rows-1))
# 光標下移 rows-1 行到最后一行,清空最后一行
self.streamOut('\033[{}B\033[K'.format(rows-1))
# 清空最后一幀的所有行(從倒數第二行起)
for i in range(rows-1):
# 光標上移一行
self.streamOut('\033[1A')
# 清空光標所在行
self.streamOut('\r\033[K')
if breakflag:
self.streamOut('User interrupt!\n')
else:
self.streamOut('Finished!\n')
if __name__ == '__main__':
import argparse
# 設置命令行參數
parser = argparse.ArgumentParser()
parser.add_argument('file',
help='Video file or charvideo file')
parser.add_argument('-e', '--export', nargs = '?', const = 'charvideo.txt',
help='Export charvideo file')
# 獲取參數
args = parser.parse_args()
v2char = V2Char(args.file)
if args.export:
v2char.export(args.export)
v2char.play()
來自:http://www.jianshu.com/p/a6699f6c98f8