一、計算機架構
在了解計算機架構之前,我們先來認識幾位對計算機的發明做出關鍵共享的幾位大佬。
1. 巴貝奇
機械計算機之父,英國貴族,曾孤軍奮戰下造出的第一臺差分機,運算精度達到了6位小數,后來又設計了20位精度的差分機,其設計理念已經達到了機械設計登峰造極的境界。
1985~1991年,倫敦科學博物館為了紀念巴貝奇誕辰200周年,根據其1849年的設計,用純19世紀的技術成功造出了差分機2號。
巴貝奇堪稱上個世紀最強大腦,他的大腦現保存在英國科學博物館。
程序員的祖師奶奶Ada正是在和巴貝奇共同工作時提出了程序循環分支等等我們現在都習以為常的編程理念。
差分機
2. 圖靈
被稱為計算機科學之父,人工智能之父。1931年圖靈進入劍橋大學國王學院,畢業后到美國普林斯頓大學攻讀博士學位,第二次世界大戰爆發后回到劍橋,后曾協助軍方破解德國的著名密碼系統Enigma,幫助盟軍取得了二戰的勝利。圖靈對于人工智能的發展有諸多貢獻,提出了一種用于判定機器是否具有智能的試驗方法,即圖靈試驗,至今,每年都有試驗的比賽。
圖靈在戰時服務的機構于1943年研制成功的CO-LOSSUS(巨人)機,這臺機器的設計采用了圖靈提出的某些概念。它用了1500個電子管,采用了光電管閱讀器;利用穿孔紙帶輸入;并采用了電子管雙穩態線路,執行計數、二進制算術及布爾代數邏輯運算,巨人機共生產了10臺,用它們出色地完成了密碼破譯工作。
強烈推薦這部根據圖靈生平改編的電影《模仿游戲》,一起感受下這個絕世天才不平凡的一生。
模仿游戲
3. 馮諾依曼-《計算機與人腦》
計算機架構主要有兩種:哈佛架構、馮諾依曼架構。現代計算機,大部分都是基于馮諾依曼體系結構。
我個人認為馮諾依曼應該是上個世紀「最聰明的人,沒有之一」。
他的個人成就在此就不說了,大家可以自行搜索,很多成就,一口君連名字都看不懂,只有博弈論還勉強知道是啥意思。
本文只討論大神對計算機的貢獻【其實計算機并不是大神的最厲害的成就,而且他也并沒有花太多時間精力在計算機的研究上】。
1955年10月,諾伊曼,被查出患有癌癥。而他幾乎是在他生命的最后時刻,于臨終的病榻上撰寫了關于人的神經系統與計算機關系的講稿。1958年,他的講稿以《計算機與人腦》為題出版。
計算機與人腦
諾依曼從數學的角度,主要是從邏輯和統計數學的角度,討論了神經系統的刺激——反應和記憶等問題,提出神經系統具有數字部分和模擬部分兩方面的特征,探討了神經系統的控制及邏輯結構。
4. 馮諾依曼架構
馮諾依曼的核心是:「存儲程序,順序執行」,規定計算機必須具有如下功能:
- 把需要的程序和數據送至計算機中;
- 必須具有長期記憶程序、數據、中間結果及最終運算結果的能力;
- 能夠完成各種算術、邏輯運算和數據傳送等數據加工處理的能力;
- 能夠根據需要控制程序走向,并能根據指令控制機器的各部件協調操作;
- 能夠按照要求將處理結果輸出給用戶
馮諾依曼架構
5. 哈佛架構
馮諾依曼結構和哈佛結構是有區別的。
馮諾依曼結構是程序存儲區和數據存儲器都是可以放到內存中,統一編碼的,而哈弗結構是分開編址的。
哈佛架構
6. 哪些處理器是哈佛架構、馮諾依曼架構?
「哈佛架構」
MCU(單片機)幾乎都是用哈佛結構,譬如廣泛使用的51單片機、典型的STM32單片機(核心是ARM Cortex-M系列的)都是哈佛結構。
「馮諾依曼架構」
PC和服務器芯片(譬如Intel AMD),ARM Cortex-A系列嵌入式芯片(譬如核心是ARM Cortex-A9的三星exynos-4412,譬如華為的麒麟970等手機芯片)等都是馮諾依曼結構。這些系統都需要大量內存,所以工作內存都是DRAM,因為他們更適合使用馮諾依曼系統。
「混合結構」
實際上現代的CPU(準確說叫SoC)基本都不是純粹的哈佛結構或馮諾依曼機構,而都是混合結構的。
比如三星exynos 4412,使用ARM的Cortex-A9核心。基于exynos 4412開發板上都配備了1024MB的DDR SDRAM,和8GB的EMMC。
正常工作時所有的程序和數據都從EMMC中加載到DDR中,也就是說不管你是指令還是數據,存儲都是在EMMC中,運行時都在DDR中,再通過cache和寄存器送給CPU去加工處理。這就是典型的馮諾依曼系統。
但是,exynos 4412內部仍然有一定容量的64KB irom和64KB iram,這些irom和iram是用于SoC引導和啟動的,芯片上電后首先會執行內部irom中固化的代碼,其實執行這些代碼時4412就好像一個MCU一樣,irom就是他的flash,iram就是他的SRAM,這又是典型的哈佛結構。
這就是混合式結構設計,而非純粹設計。之所以采用混合式設計其實就是為了各取所長而已。
不管白貓黑貓,解決問題就是好貓。
二、計算機組成
計算機系統=硬件系統+軟件系統 硬件是計算機系統的物質基礎,軟件是計算機系統的靈魂。硬件和軟件是相輔相成的,不可分割的整體。
計算機組成
1).輸入設備
輸入設備的任務是把人們編好的程序和原始數據送到計算機中去,并且將它們轉換成計算機內部所能識別和接受的信息方式。常用的有鍵盤、鼠標、掃描儀等。
2).輸出設備
輸出設備的任務是將計算機的處理結果以人或其他設備所能接受的形式送出計算機。常用的有顯示器、打印機、繪圖儀等。
3).存儲器、CPU
見第三節
4). 計算機的總線結構
將各大基本部件,按某種方式連接起來就構成了計算機的硬件系統。
系統總線包含有三種不同功能的總線,即數據總線DB(Data Bus)、地址總線AB(Address Bus)和控制總線CB(Control Bus)。
數據總線DB 用于傳送數據信息。數據總線的位數是微型計算機的一個重要指標,通常與微處理的字長相一致。例如Intel 8086微處理器字長16位,其數據總線寬度也是16位。
地址總線AB 專門用來傳送地址的。地址總線的位數決定了CPU可直接尋址的內存空間大小,比如8位微機的地址總線為16位,則其最大可尋址空間為216=64KB,16位微型機的地址總線為20位,其可尋址空間為220=1MB。控制總線CB 用來傳送控制信號和時序信號。控制信號中,有的是微處理器送往存儲器和I/O接口電路的,如讀/寫信號,片選信號、中斷響應信號等;也有是其它部件反饋給CPU的,比如:中斷申請信號、復位信號、總線請求信號、限備就緒信號等。控制總線的具體情況取決于CPU。
在這里插入圖片描述
三、 CPU工作原理
CPU內部主要包括運算器和控制器。
指令
1) 存儲器
存儲器是用來存放程序和數據的部件,它是一個記憶裝置,也是計算機能夠實現“存儲程序控制”的基礎。
包括:Cache、主存儲器、輔助存儲器。
「高速緩沖存儲器(Cache)」CPU可以直接訪問,用來存放當前正在執行的程序中的活躍部分,以便快速地向CPU提供指令和數據。
「主存儲器」可由CPU直接訪問,用來存放當前正在執行的程序和數據。
「輔助存儲器」設置在主機外部,CPU不能直接訪問,用來存放暫時不參與運行的程序和數據,需要時再傳送到主存。
存儲器
2) 運算器
運算器的核心是算術邏輯運算部件ALU,還包括若干個寄存器(如累加寄存器、暫存器等)。
ALU可以執行算術運算(包括加減乘數等基本運算及其附加運算)和邏輯運算(包括移位、邏輯測試或兩個值比較)。相對控制單元而言,運算器接受控制單元的命令而進行動作,即運算單元所進行的全部操作都是由控制單元發出的控制信號來指揮的,所以它是執行部件。
運算器
3) 控制器
控制單元是整個CPU的指揮控制中心,由程序計數器PC(Program Counter), 指令寄存器IR(Instruction Register)、指令譯碼器ID(Instruction Decoder)和操作控制器OC(Operation Controller)等組成,對協調整個電腦有序工作極為重要。
它根據用戶預先編好的程序,依次從存儲器中取出各條指令,放在指令寄存器IR中,通過指令譯碼(分析)確定應該進行什么操作,然后通過操作控制器OC,按確定的時序,向相應的部件發出微操作控制信號。操作控制器OC中主要包括節拍脈沖發生器、控制矩陣、時鐘脈沖發生器、復位電路和啟停電路等控制邏輯。
控制器
4) CPU的運行原理總結
控制單元在時序脈沖的作用下,將指令計數器里所指向的指令地址(這個地址是在內存里的)送到地址總線上去,然后CPU將這個地址里的指令讀到指令寄存器進行譯碼。
對于執行指令過程中所需要用到的數據,會將數據地址也送到地址總線,然后CPU把數據讀到CPU的內部存儲單元(就是內部寄存器)暫存起來,最后命令運算單元對數據進行處理加工。
周而復始,一直這樣執行下去。
5) 指令執行過程
一條指令的執行通常包括以下4個步驟:
指令執行過程
1、取指令:CPU的控制器從內存讀取一條指令并放入指令寄存器。2、指令譯碼:指令寄存器中的指令經過譯碼,決定該指令應進行何種操作(就是指令里的操作碼)、操作數在哪里(操作數的地址)。3、 執行指令,分兩個階段“取操作數”和“進行運算”。4、 修改指令計數器,決定下一條指令的地址。
6) ARM技術特征
ARM的成功,一方面得益于它獨特的公司運作模式,另一方面,當然來自于ARM處理器自身的優良性能。作為一種先進的RISC處理器,ARM處理器有如下特點。
- 體積小、低功耗、低成本、高性能。
- 支持Thumb(16位)/ARM(32位)雙指令集,能很好地兼容8位/16位器件。
- 大量使用寄存器,指令執行速度更快。
- 大多數數據操作都在寄存器中完成。
- 尋址方式靈活簡單,執行效率高。
- 指令長度固定。此處有必要講解一下RISC微處理器的概念及其與CISC微處理器的區別。
7) ARM體系架構的發展
體系架構的定義:體系架構定義了指令集(ISA)和基于這一體系架構下處理器的編程模型。基于同種體系架構可以有多種處理器,每個處理器性能不同,所面向的應用不同,每個處理器的實現都要遵循這一體系結構。ARM體系架構為嵌入系統發展商提供很高的系統性能,同時保持優異的功耗和效率。
ARM體系架構為滿足ARM合作者及設計領域的一般需求正穩步發展。目前,ARM體系架構共定義了8個版本,從版本1到版本8,ARM體系的指令集功能不斷擴大,不同系列的ARM處理器,性能差別很大,應用范圍和對象也不盡相同,但是,如果是相同的ARM體系架構,那么基于它們的應用軟件是兼容的。
下面我們簡單介紹下 V7/V8架構。
v7架構
ARMv7架構是在ARMv6架構的基礎上誕生的。該架構采用了Thumb-2技術,它是在ARM的Thumb代碼壓縮技術的基礎上發展起來的,并且保持了對現存ARM解決方案的完整的代碼兼容性。Thumb-2技術比純32位代碼少使用31%的內存,減小了系統開銷,同時能夠提供比已有的基于Thumb技術的解決方案高出38%的性能。ARMV7架構還采用了NEON技術,將DSP和媒體處理能力提高了近4倍。并支持改良的浮點運算,滿足下一代3D圖形、游戲物理應用及傳統嵌入式控制應用的需求。
v8架構
ARMv8架構是在32位ARM架構上進行開發的,將被首先用于對擴展虛擬地址和64位數據處理技術有更高要求的產品領域,如企業應用、高檔消費電子產品。ARMv8架構包含兩個執行狀態:AArch64和AArch32。AArch64執行狀態針對64位處理技術,引入了一個全新指令集A64,可以存取大虛擬地址空間;而AArch32執行狀態將支持現有的ARM指令集。目前的ARMv7架構的主要特性都將在ARMv8架構中得以保留或進一步拓展,如TrustZone技術、虛擬化技術及NEON advanced SIMD技術等。
8) ARM 微處理器架構
ARM內核采用RISC體系架構。ARM體系架構的主要特征如下。
- 采用大量的寄存器,它們都可以用于多種用途。
- 采用Load/Store體系架構。
- 每條指令都條件執行。
- 采用多寄存器的Load/Store指令。
- 能夠在單時鐘周期執行的單條指令內完成一項普通的移位操作和一項普通的ALU操作。
- 通過協處理器指令集來擴展ARM指令集,包括在編程模式中增加了新的寄存器和數據類型。
- 如果把Thumb指令集也當做ARM體系架構的一部分,那么在Thumb體系架構中還可以高密度16位壓縮形式表示指令集。
9) ARM指令
ARM指令是RISC(Reduced Instruction Set Computing),即精簡執令運算集,RISC把著眼點放在如何使計算機的結構更加簡單和如何使計算機的處理速度更加快速上。RISC選取了使用頻率最高的簡單指令,拋棄復雜指令,固定指令長度,減少指令格式和尋址方式,不用或少用微碼控制。這些特點使得RISC非常適合嵌入式處理器。
RISC可以實現以相對少的晶體管設計出極快的微處理器。通過研究發現,只有大約20%的指令是最常用的,把處理器能執行的指令數目減少到最低限度,對它們的執行過行優化,就可以極大地提高處理的工作速度。
一般來說,RISC處理器比同等的CISC(Complex Instruction Set Computer,復雜指令集計算機)處理器要快50%-75%,同時RISC處理器更容易設計和糾錯。
一般指令格式如下:
指令格式
「操作碼:」操作碼就是匯編語言里的mov,add,jmp等符號碼;
「操作數地址:」用于說明該指令需要的操作數所在的地方,是在內存里還是在CPU的內部寄存器里。
實際上的機器指令格式遠比這個復雜,下圖是常用的ARM指令格式:
ARM 指令格式
關于這些機器指令格式,后面我們會挑選其中幾個分析,對于我們大部分讀者來說,沒有必要花太多精力去研究這些機器指令,只需要大概了解即可。
關于CPU我們從宏觀上把握到這個程度就OK了,后面我們會逐步進入后續階段的學習,介紹ARM寄存器模式、異常、尋址、匯編指令,以及C代碼中嵌入的匯編語言的寫法。
四、SOC
SOC: 系統芯片是一個將計算機或其他電子系統集成單一芯片的集成電路。系統芯片可以處理數字信號、模擬信號、混合信號甚至更高頻率的信號。
從狹義角度講,它是信息系統核心的芯片集成,是將系統關鍵部件集成在一塊芯片上; 從廣義角度講, SoC是一個微小型系統,如果說中央處理器(CPU)是大腦,那么SoC就是包括大腦、心臟、眼睛和手的系統。
1. ARM base Soc
嵌入式系統中常常要使用系統芯片。系統芯片的集成規模很大,一般達到幾百萬門到幾千萬門。SOC相對比較靈活,它可以將arm架構的處理器與一些專用的外圍芯片集成到一起,組成一個系統。
下圖是一個典型的基于ARM架構的SOC架構圖。
ARM base Soc
一個典型的基于ARM的Soc架構通常包含以下幾個主要部件:
- ARM Processor core 處理器核
- Clocks and Reset Controller 時鐘和復位電路
- Interrupt Controller 中斷控制器
- ARM Propherals 外部設備
- GPIO
- DMA Port
- External Memory Interface 外部內存接口
- On chip RAM 偏上RAM
- AHB、APB總線
其實現有的ARM處理器如Hisi-3507、exynos-4412等處理器都是一個SOC系統,尤其是應用處理器它集成了許多外圍的器件,為執行更復雜的任務、更復雜的應用提供了強大的支持。
該架構是我們理解匯編指令和編寫裸機程序的基石。
當我們拿到一個新的SOC的datasheet,首先就要根據這個架構,來查看SOC的「RAM空間、時鐘頻率、包括哪些外部設備的控制器,各個外設控制器的操作原理,各個外設對GPIO的引腳復用情況、各個控制器的SFR地址、中斷控制器是如何管理眾多中斷源的等等」。
2. 三星 Exynos 4412
2012年初,三星正式推出了自家的首款四核移動處理器Exynos4412。
下面三星的exynos 4412的SOC。
Exynos 4412 SCP結構框圖
如上圖所示,exynos 4412主要包括以下模塊:
- 4(quad)個Cortex-A9處理器
- 1MB的 L2 Cache
- Interrupt Controller 中斷控制器,管理所有的中斷源
- Interrupt Combiner 中斷控制器,管理soc內的一些中斷源
- NEON ARM 架構處理器擴展結構,旨在通過加速多媒體(video/audio)編解碼,用戶界面,2D/3D圖形及游戲來提高人對多媒體的體驗
- DRAM、Internal RAM、NAND Flash、SROM Controller 各種存儲設備的控制器
- SDIO、USB、I2C、UART、SPI等總線
- RTC、Watchdog Timer
- Audio Subsystem 聲音子系統
- IIS(Integrate Interface of Sound)接口 ,集成語音接口
- Power Management電源管理
- Multimedia Block 多媒體模塊
這款新Exynos四核處理器,擁有32nm HKMG(高K金屬柵極技術)制程,支持雙通道LPDDR21066。三星公司已將這顆圖形處理器主頻由此前的266MHz提升至400MHz,新聞稿指出其會比現有的雙核機型整體性能提升60%,圖像處理能力提升50%。
三星智能手機Galaxy S III手機就采用了Exynos4412處理器。
學習ARM就必須深刻了解soc架構,官方提供的datasheet是我們學習ARM、編寫驅動程序的基石,該手冊內容比較多,我們并不需要每一章都掌握,用到哪個地方,我們就去學習即可。
exynos 4412 datahseet 后天回復【exynos】下載。
后續的文章,會基于華清遠見的FS-4412開發板為大家講解常見的外設的原理,并編寫對應的驅動程序。
下一篇預告:《2. 從0開始學ARM-CPU原理,基于ARM的SOC講解》