樹心幽徑

20200430用LibreOffice的scalc進行迴歸分析
2020/04/30,07:53

(一)製作f(x)=2x+1的線性迴歸線 

(1-1)在scalc中新增一工作表(工作表名為y=2x+1)並在A1:C10輸入如下九筆資料

(1-2)選B1:C10/插入/圖表/xy(散佈)圖/挑僅顯示點/點選目前xy圖中的任一資料點/按右鍵/插入趨勢線/迴歸類型挑「線性」/勾顯示方程式及顯示決定係數,成功出現如下迴歸分析趨勢圖。

alt

(二)製作f(x)=x^2的線性迴歸線

(2-1)在scalc中新增另一工作表(工作表名為y=x^2)並在A1:C10輸入如下九筆資料

(2-2)選B1:C10/插入/圖表/xy(散佈)圖/挑僅顯示點/點選目前xy圖中的任一資料點/按右鍵/插入趨勢線/迴歸類型挑「指數」/勾顯示方程式及顯示決定係數,成功出現如下迴歸分析趨勢圖。

alt

(2-3)迴歸線處按右處刪除(2-2)的線,在同(2-2)插入另一條迴歸線,但本次迴歸類型挑2次方,結果如下。

alt

(三) 參考範例:20200506LinearTrend.ods 下載 (14 KB) | created 06 五月, 2020

 

(四) 使用scalc輸入如下資料(20200505scalc_knn.ods 下載 (12 KB))並上傳至你的google雲端硬碟並製作w-h散佈圖: 

no w h kind
101 3.5 46 南極企鵝
102 1.3 40 小藍企鵝
103 4.1 61 南極企鵝
104 2.1 48 加拉帕戈企鵝
105 2.5 50 加拉帕戈企鵝
106 1.2 39 小藍企鵝
107 1.1 43 小藍企鵝
108 2.6 53 加拉帕戈企鵝
109 1.4 44 小藍企鵝
110 3.9 59 南極企鵝
20200428安裝並使用python程式開發環境編寫第1個程式並下載執行k近鄰分類及k-平均聚類程式
2020/04/28,08:00

(1-1)自python官網下載Windows x86-64 executable installer(python-3.7.4-amd64.exe 約25.4MB)並執行之

(1-2)安裝時請選取要將python執行檔所在(C:\Users\USER\AppData\Local\Programs\Python\Python37\)加入WINDOWS路徑變數中Path中。

python主程式裝在C:\Users\USER\AppData\Local\Programs\Python\Python37\python.exe

(1-3)由windows開始功能表執行 IDLE(python 3.7 64bit)

(1-4)按CTRL+N在PYTHON文字編輯器編寫如下程式碼,並存為 d:\1.py 

a = int(input('a='))
b = int(input('b='))
c = a+b
print('a=',a,"b=", b, 'c=',c)
print('{0}+{1}={2}'.format(a,b,c))

(1-5)在PYTHON文字編輯器按F5可儲存編寫的程式碼並執行之:

 a=12345678
b=87654321
a= 12345678 b= 87654321 c= 99999999
12345678+87654321=99999999


(2-0)在WIN10控制台/系統/進階系統設定/環境變數/使用者變數/PATH/編輯/將C:\Users\Administrator\AppData\Local\Programs\Python\Python37\Scripts新增到使用者PATH變數中。

 

(2-1)執行cmd命令提示字元並用輸入cd指令切換工作目錄如下:

      cd C:\Users\Administrator\AppData\Local\Programs\Python\Python37\Scripts

 

(2-2) 在cmd中輸入如下指令來安裝pip:

   python -m pip install --upgrade pip

C:\Users\…\Python37>python -m pip install --upgrade pip


(2-3)在cmd中輸入如下指令來裝numpy 陣列模組:

C:\Users\…\Python37\Scripts>pip install numpy

(3)用pip裝matplotlib

pip3.7.exe  install matplotlib

 

(4)用pip裝sklearn

pip3.7.exe  install sklearn

 

(5)下載並執行k近鄰分類

(5-1)自https://scikit-learn.org下載k近鄰分類模擬程式並將上方程式碼拷入記事本並存為d:\knbc.py

(5-2)執行 python knbc.py結果如下:

alt

 
(6)下載並執行k-平均聚類程式
 

(6-1)下載如下程式碼並存為D:\kmean.py  下載 (448 bytes) | created 28 十月, 2019

  (6-2)修改程式碼中的k=2執行 python kmean.py結果如下: 
alt

(6-3)修改程式碼中的k=3執行 python kmean.py結果如下: 

alt


 

REF1:20191014在windows7安裝並使用python3.7.4來剖析數字序列字串 »

REF2:20191021用python執行k近鄰分類、k-平均聚類、標註傳播

 

20200421查詢使用政府資料開放平台並將下載的csv檔用scalc及google電子試算表編修
2020/04/21,14:20

 

 

(0)確定已下載並安裝 LibreOffice6.3.5(作業系統 Windows x86_64 )

 下載網址:https://www.libreoffice.org/donate/dl/win-x86_64/6.3.5/zh-TW/LibreOffice_6.3.5_Win_x64.msi

https://zh-tw.libreoffice.org/download


(1)連上 https://data.gov.tw/

(2)在查詢處輸入「電影票房」查得文化部2020/04/16提供的 全國電影票房統計數據/
    點csv檔將之(datagovtw_dataset_20200421.csv)下載為d:\a.csv (csv檔是用逗號分隔資料欄位的純文字檔)。

alt

(3)按WIN鍵/輸入notepad d:\a.csv,用記事本開啟d:\a.csv,發現內容為metadata(描述資料的資料)。

 

(4)按WIN鍵/輸入scalc d:\a.csv, 會出現「文字匯入」視窗,字元集要選取UTF8,才可用scalc正確解讀資料檔並打開,將剛打開檔案的工作表中的c02儲存格的超連結檔案(https://opendata.culture.tw/upload/dataSource/2018-08-09/1c3753a5-50f4-44f8-a75b-2b4d0dd2a143/69c6f154369fc266e8a3593f83d3b444.csv)下載為d:\b.csv

 

(5) 執行notepad d:\b.csv

alt

 

(6) 執行scalc d:\b.csv /出現文字匯入視窗/字元集要選取UTF8/依第K欄的值降序/發現(復仇者聯盟)票房金額第1名為640740755元。

 

alt

 

(7-1)將政府公開資料平台上的桃園市汽車竊盜點位(10806_2.csv下載 )下載為d:\c.csv

(7-2)執行 scalc d:\c.csv 將如上檔案以LibreOpeOffice 的Calc試算表軟體打開

(7-3)出現文字匯入交談視窗:字元集請選取UTF-8

alt

(7-4)存檔並選取ODS檔案格式,存為「d:\d.ods」

 

(8-1)在K1輸入dis,在L1輸入rank、O1輸入lat、p1輸入lon 

(8-2)在n2輸入待評估,O2輸入24.93、p2輸入121.26

(9-1)在k2輸入公式「 =SQRT((O$2-H2)*(O$2-H2)+(P$2-I2)*(P$2-I2))」

(9-2)把k2的公式拷給第k欄的其他所有儲存格(k3:k2844)

(9-3)J1輸入BREAU2在J2輸入公式 =F2並把J2的公式拷給第J欄的其他所有儲存格(J3:J2844)

(9-4)選a1:j2844/資料/排序/排序第1鍵選BREAU:升序/排序第2鍵選TIME:降序

(9-5)在L2輸入公式 「=RANK(K2,K$2:K$2844,1) 」 並將此公式拷給其他L欄儲存格(L3:L2844)

(9-6)在N5輸入「八德分局」,在N6輸入「大溪分局」,在N7輸入「桃園分局

 (9-7)在M5輸入公式 「=COUNTIFS(J:J,"=" & N5,L:L,"<10") 」並將之拷給M6及M7

(9-8)在M9輸入「最大值」,在M10輸入公式=MAX(M5:M7)

(9-9)在N10輸入公式「=VLOOKUP(M10,M5:N7,2)」

alt

 

(10-1)選取H1:H15(lat緯度資料欄)、再選取I1:I15(lon經度資料欄)、再選取K1:K15(dis:和評估點距離欄)。

(10-2)選取插入功能表/圖表/挑泡泡圖/資料範圍接受「以欄表示的資料列」、勾第一列作為標籤

        /「資料序列」接受預設值/完成。

(10-3)點選泡泡圖的泡泡,將其顏色改為橙色,如下圖。

alt

 

(11-1)篩選出最近前十名:

選取A1:L2844/資料/更多篩選/標準篩選/勾「範圍含有欄標籤」(如下圖)/設定條件為rank<10/確定

alt

(11-2)再次回存為「d:\d.ods」

(12-1) 將本檔上傳至google雲端硬碟,用google試算表打開。

(12-2) 在A2851 輸入 =query(A1:J2844,"select G,H,I where G='八德所'")

(12-3) 在H2851 輸入 =query(A1:J2844,"select G,avg(H),avg(I) group by G")

(12-4) 在L2851 輸入 =query(A1:J2844,"select G,avg(H),avg(I) where F='大溪分局' group by G")

查詢結果如下圖:

alt

 


REF 1:20191101安裝Openoffice並使用calc來處理「桃園市汽車竊盜點位csv檔」

 

20200414用LibreOffice的scalc電子試算表製作新冠肺炎統計圖表
2020/04/07,08:56

參考:20200317使用LibreOffice calc並將指定列印範圍的內容列印成pdf檔

20200528肺炎疫情統計.ods 下載 (45 KB)

(0)確定已下載並安裝 LibreOffice6.3.5(作業系統 Windows x86_64 )

 下載網址:https://www.libreoffice.org/donate/dl/win-x86_64/6.3.5/zh-TW/LibreOffice_6.3.5_Win_x64.msi

https://zh-tw.libreoffice.org/download

(1)執行LibreOffice在CALC新增一個「全球」的工作表/並於「A1:C27」輸入如下「日期、全球確診累計、全球死亡累計」等三欄資料(資料來源衛福部網頁:https://www.mohw.gov.tw/mp-1.html):

alt

 

(2-1)於D2輸入公式=C2/B2   ,並將之拷給D3:D27

(2-2)於E3輸入公式=D3-D2 ,並將之拷給E4:E27

 

(3-1)選取B1:B27/插入/圖表/面積圖/完成/出現「全球確診累計面積圖」

(3-2)選取C1:C27/插入/圖表/直條圖/完成/出現「全球確診累計死亡直條圖」

(3-3)選取D1:D27/插入/圖表/線條圖/完成/出現「全球確診死亡率線條圖」

(3-4)選取E1:E27/插入/圖表/面積圖/完成/出現「 死亡率增量面積圖」

 

(4-1)在CALC新增另一個工作表並改名為「台灣」

(4-2)輸入如下A2:M30的各欄資料:

alt

 

(4-3a)於N2輸入「全球確診死亡率」,於N3輸入公式=M3/L3   ,並將之拷給N4:N30。

(4-3b)於O2輸入國內確診康復率,於O3輸入公式=M3/L3 並將之拷給O4:O30。 

        選取O2:O30/插入/圖表/線條圖/完成/出現「國內確診康復率線條圖」


(4-3c)於P2輸入本日確診數名次,於P3輸入公式=RANK(D3,D$3:D$30) 並將之拷給P4:P30。         選取P2:P30/插入/圖表/線條圖/完成/出現「本日確診數名次線條圖」

(4-3d)於Q2輸入本日死亡數名次,於Q3輸入公式=RANK(J3,J$3:J$30)  並將之拷給Q4:Q30。 

 

(5-1)將以上編修存為D:\a.ods,並結束CALC

    參考範例檔:20200506肺炎疫情統計.ods 下載 (36 KB) | created 06 五月, 2020

 

(5-2)WIN鍵/執行 scalc d:\a.ods, 成功用LibreOffice calc電子試算表軟體開啟a.ods檔

 

 

(6)線性迴歸分析:

(6-1A)選取「全球」工作表的d1:d37(全球確診死亡率)/插入/圖表/xy(散佈)圖/挑僅顯示點/點選目前xy圖中的任一資料點/按右鍵/插入趨勢線/線性/勾顯示方程式及顯示決定係數,成功出現迴歸分析趨勢圖。

(6-1b)選取「全球」工作表的C1:C37(全球確診死亡累計)/插入/圖表/xy(散佈)圖/挑僅顯示點/點選目前xy圖中的任一資料點/按右鍵/插入趨勢線/線性/勾顯示方程式及顯示決定係數,成功出現迴歸分析趨勢圖。

(6-1C)選取「全球」工作表的b1:b37(全球確診累計)/插入/圖表/xy(散佈)圖/挑僅顯示點/點選目前xy圖中的任一資料點/按右鍵/插入趨勢線/線性/勾顯示方程式及顯示決定係數,成功出現如下迴歸分析趨勢圖。

REF:http://blog.bod.idv.tw/2011/03/openoffice-calcxy.html

alt

(6-2)選取「台灣」工作表的P2:P40(國內確診康復率)/插入/圖表/xy(散佈)圖/點選目前xy圖中的任一資料點/按右鍵/插入趨勢線/線性/勾顯示方程式及顯示決定係數. 成功出現迴歸分析趨勢圖。


(7)點選「台灣」工作表/檔案/另存新檔/存檔類型挑「CSV文字檔」/接受「使用文字CSV格式」/「字元集:正體中文」/「欄位分隔符:採單引號」/「文字分隔符:採雙引號」/接受「儲存所示儲存格內容」/只會存目前所在的工作表內容/存檔名為 d:\b.csv/結束scalc。

(8)執行 notepad d:\b.csv  成功用記事本開啟csv檔。

(9)執行 scalc d:\b.csv 出現文字轉換對話盒/接受全部/成功用LibreOffice calc電子試算表軟體開啟csv檔。

(10)執行cmd(命令提示字元)/再執行 type d:\b.csv/顯示csv檔案內容如下:

C:\Users\treehrt>type d:\b.csv
台灣新冠肺炎統計(資料來源:衛福部臉書),,,,,,,,,,,,,,,,
日期,"累計確診","新增案號","本日確診","本日境外","本日境內","累計境外","累計本土","累計解除隔離","本日死亡","累計死亡","全球確診累計","全球累計死亡","全球確診死亡率","國內確診康復率",累計通報,累計排除
:

:

20200321,153,136~153,18,18,0,120,33,28,0,2,263681,11182,4.24%,18%,22743,20910
20200322,169,154~169,16,13,3,133,36,28,0,2,297207,12790,4.30%,17%,23805,21790

:


(11)美國高中生設計武漢肺炎查詢網站COVID-19 Stats

 
Accessible and Valid XHTML 1.0 Strict and CSS Powered by LifeType