http://netstat.stat.tku.edu.tw
(User from: 54.92.155.160)
機率  |  統計  |  Data Mining  |  資料處理  |  DEMO  |  Data  |  Links  |  Books  |  相關文件  |   ( ENGLISH )

Home

機率
 計算/查表
 隨機亂數
 Density plots
統計
 基本統計
 卡方檢定
 迴歸分析
 ANOVA
 時間數列
 多變量分析
 品質管制
 無母數方法
Data Mining
 決策樹
 Logistic
 判別分析
 集群分析
 類神經網路
 關聯規則分析
 ALL Methods

Net-Stat淡江大學統計學系 (中華民國台灣, 台北縣淡水鎮) 以 R 軟體為主所發展出來的一套線上統計處理介面. Net-Stat 的目標, 是讓統計計算與 WWW 結合, 不管您身在何方, 只要能接觸網路, 就可以執行機率與統計計算, 擺脫商用統計軟體的時空限制. Net-Stat 並不想 取代商業統計軟體, 也不想與商業統計軟體競爭, 因為 Net-Stat 的定位不同. 我們發展這套軟體的主要目的有四個:

  • Net-Stat 是建立在 Linux 作業系統上. Linux 作業系統是以商業為主流 的文明偏態下, 滌清眾人靈魂的一股清新的自由氣息. 我們想藉這個機會展現 Linux 作業系統的雄厚實力.

  • 不必隨身攜帶統計軟體, 只要能上網, 就算是在網咖 (網咖應該不會安裝 SAS), 也一樣可以計算統計. 這可稱為 Statistics-Everywhere.

  • 讓無法負擔昂貴商業統計軟體(動輒上萬) 的人們有另一重選擇, 而且不用擔心版權問題. 我們也簡化了多數 free domain 與 GPL 統計程式 的輸入過程, 讓使用者不必熟悉特定的程式語言 (例如 Fortran 跟 R) 就可以 執行機率統計計算.

  • 絕大多數商業統計軟體目前都已經 Windows 化, 圖形化, 對於視障者而言, 這是很不方便的. 多數視障朋友上網使用的溜覽器是文字界面, 而且不支援 java. 所以我們將致力於改善 Net-Stat 的使用者介面, 讓視障朋友 也能輕鬆自在地計算統計.

Net-Stat 事實上是一套整合介面軟體. 本系收集並評估網路上各種可以免費使用 (Free Domain), 或擁有 GPL 自由軟體版權的統計與數學計算程式, 讓使用者可以透過 Net-Stat於線上執行各類統計分析.

組成 Net-Stat 的軟體包含 PHP 程式語言(網頁前端), Fortran 程式語言 (統計計算與後端套件軟體連結), 以及其他統計後端程式/軟體如下 (這些程式均可在 Netlib 或 Statlib 找到) :

  • ranlib, dcdflin, |STAT, Linpack, StarPac
  • R 軟體
  • 其他 Stat-Lib 與 Net-Lib 上的非套裝 Fortran 程式

Net-Stat 目前是設在 Linux 作業系統 + P4 2.0G (4039.87 BogoMIPS) CPU 主機

Net-Stat 目前還在測試與擴充統計模組階段, 預計未來發展方向:

  • 加入視障介面的考量, 完全不用 java (目前僅有 1 行程式用到)
  • 平行處理: R 軟體 具有 PVM 附加功能, 可多機平行計算
  • 模組化: 讓熱心的統計專業人士可以依照模組定義來增加新的統計分析工具
    這包含 R 軟體 以及其他後端統計軟體 (by Fortran, C, etc) 的轉換模組.
  • 可攜性: 讓這套軟體能在各類 UNIX Servers 與 Windows Server 執行
  • 文件: 撰寫模組整合規格文件
  • Open Source: 開放程式碼下載

(Please forward questions about TKU Net-Stat to Steve Chen)


關於 TKU Net-Stat 與 R 軟體

R 軟體 (R-Project) 是一套很像商業統計軟體 S-Plus免費 統計軟體, 由國外一群熱心人士所寫成. R 的語法與圖形功能幾乎跟 S-Plus 一模一樣, 大多數的 S-Plus 程式檔 也可在 R 上面順利執行. 目前, R 有 UNIX 版本, Machintosh 版本, 跟 Windows 版本, 可以在 R project 網頁 免費取得.

R 的主要優點 是它現有的機率統計模組非常的多, 而且擴充性極強, 許多 R 的熱心使用者也都會在網站公布他們撰寫的新機率統計模組. 因此, 我們經常 可以看到 R 的網站上出現期刊上才發表不久的統計計算方法, 而商業統計軟體 往往要經過數月或數年的歷程才會新增最新的統計方法.

R 軟體的主要介面是互動交談命令模式, 使用者必須先熟悉 R 的程式語言語法, 才能執行 R 的各項功能. 因此, R 是一套「擁有許多機率統計功能的 程式語言」,不是直接點選就可以操作的統計軟體. 一般使用者如果不想學習 R 的程式語法與資料結構, 將會很難將 R 拿來作機率統計運算.

事實上, 這也是 R 的主要 缺點: 為了因應各類不同的需求, R 的變數型態與資料結構比一般程式語言複雜. 目前多數 R 線上文件共通的缺點, 不是過於簡略, 就是缺乏針對初學者 所需的普遍性操作原則. 這些文件上的範例程式, 往往是針對特別設計的資料檔 (ad hoc program scripts), 操作看似輕鬆容易. 然而, 當初學者開始要用 R 來分析自己的資料時, 往往就會卡在資料輸入與變數轉換的瓶頸. 因此, 一般使用者較難在短期內掌握 R 的特色, 更不用提那些 沒有程式語言基礎的統計應用者. 本站的目的之一, 就是將 R 與其他 free domain 統計軟體轉換成可直接在網頁上 即時執行的 Web 介面, 並且提供寫好的各項簡單 menu, 讓使用者不必知道 R 的 程式語法, 也能運用 R 的超強統計分析功能. 同時, 我們也在 output 畫面附上 R 的相關語法, 讓初學者可以同時學習 R 程式

目前有兩套 CGI 軟體 (RcgiRweb) 可以作出讓 R 軟體 具有類似的 Web 介面功能,但是, 它們都是以 Perl 程式寫成, 而且缺乏模組化的 擴充能力, 以及包含中文說明或中文圖形的能力. 以 Rcgi 為例, 它是一套 讓使用者在 Web 上輸入 R程式的介面, 對不懂 R程式語言的人 或初學者而言不是很方便. 此外, 這兩套軟體都只針對 R 軟體, 並沒有提供其他後端統計軟體的介面.

Net-Stat 是以 PHP 程式語言為主, 加上 gd 與其他圖形工具來改善這些缺點. PHP 程式語言的擴充能力很強, 而且沒有 Perl 語言的部分缺點 (例如, 某些 Perl 程式運用了太多特殊獨門技巧, 導致其他熱心的使用者 很難去擴充原有程式). 事實上, Net-Stat 可以處理任何具有「批次處理 (batch-processing)」功能的統計程式/軟體, 並擔任其 Web 介面. 所以 Net-Stat 的擴充性並不受限於 R.