持續收集中......
法人:
工業技術研究院
資策會
企業+民間:
台灣微軟
中華資料採礦協會
2013年11月23日 星期六
2013年11月18日 星期一
資料探勘軟體Weka之安裝篇
最近在準備資料探勘相關課程,為了讓大家能快快上手玩資料,這邊就寫整理一篇Weka的安裝篇給大家。
Weka是以Java為基礎的資料探勘(Data mining )與(Machine learning)軟體,也是自由軟體(Open Source Software)。Weka全名為懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),而Weka同時也是紐西蘭(New Zealand)的特有種鳥名,而開發者也是來自紐西蘭的懷卡託大學(The University of Waikato)。
(圖片來源:網路)
Weka整合了大量的資料探勘的演算法,因此在2005年第11屆ACM SIGKDD國際會議上,Weka小組獲得了資料探勘與知識探索的最高服務獎(2005 ACM SIGKDD Service Award)。
首先我們先到Weka的官方網頁中下載Weka 3.6版本,依據個人電腦版本(Windows
x86、Windows x64、Mac OS X、Linux等)來做下載,本篇範例是下載Windowsx86包含Java VM 1.7的版本,大約51MB。
進入安裝畫面後,跟一般軟體安裝一樣,非常簡單,Next, Next....Next!!
按下「Next」
按下「I Agree」
按下「Next」
按下「Next」
按下「Install」,就開始安裝!!
接下來是安裝 Java,如果您確定電腦有就可以跳過,如果不確定就繼續安裝。
按下「Finish」,就可看到Weka的畫面了!
Weka 工具畫面,請點選「Explorer」
因此要進行中文資料的參數調整。
首先我們要到Weka的資料夾中找尋RunWeka.ini的文件,使用記事本開啟。
接著在密密麻麻的文字中找 fileEncoding=Cp1252。
接著將Cp1252 換成 UTF-8後儲存,接下來將Weka重新啟動即可。
Weka如有無法啟動的問題,表示環境變量需設定,如下:
PATH:C:\Program Files\Java\jre7\bin
延伸閱讀:
Data Mining: Practical Machine Learning Tools and Techniques, Third Edition台灣生活資料科學培養計畫 Data Science Program
2013年11月6日 星期三
2013資料科學家書籍學習清單
最近一直有朋友詢問,如果想當資料科學家,有沒有相關的書籍可以提供修讀。於是這邊整理一些清單如下,包含一些個人推薦書籍,歡迎大家一起推薦書籍:
資料探勘書籍(Data Mining Books)
Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management
Data Mining: Concepts and Techniques, Third Edition
Handbook of Statistical Analysis and Data Mining Applications
Introduction to Data Mining
Contrast Data Mining: Concepts, Algorithms, and Applications
Principles of Data Mining
Data Mining: Introductory and Advanced Topics
A First Course in Machine Learning
工具書籍(Tool Books)
R in a Nutshell
Data Mining with R: Learning with Case Studies
R Cookbook
R Graphics Cookbook
R in Action: Data Analysis and Graphics with R
Introductory Statistics with R
R by Example
Software for Data Analysis: Programming with R
Interactive and Dynamic Graphics for Data Analysis: With R and Ggobi
Data Mining: Practical Machine Learning Tools and Techniques, Third Edition
資料庫書籍(Database Books)
Database Systems
Database Systems: A Practical Approach to Design, Implementation and Management (5th Edition)
Database Management Systems
User Interface Design for Mere Mortals™
Beginning Database Design
資料倉儲書籍(Data Warehousing Books)
Building the Data Warehouse
The Data Warehouse Lifecycle Toolkit
The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling
Mastering Data Warehouse Design: Relational and Dimensional Techniques
Data Warehouse and Business Information Quality
資料視覺化(Data visualization)
Visualizing Data
資料探勘書籍(Data Mining Books)
Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management
Data Mining: Concepts and Techniques, Third Edition
Handbook of Statistical Analysis and Data Mining Applications
Introduction to Data Mining
Contrast Data Mining: Concepts, Algorithms, and Applications
Principles of Data Mining
Data Mining: Introductory and Advanced Topics
A First Course in Machine Learning
工具書籍(Tool Books)
R in a Nutshell
Data Mining with R: Learning with Case Studies
R Cookbook
R Graphics Cookbook
R in Action: Data Analysis and Graphics with R
Introductory Statistics with R
R by Example
Software for Data Analysis: Programming with R
Interactive and Dynamic Graphics for Data Analysis: With R and Ggobi
Data Mining: Practical Machine Learning Tools and Techniques, Third Edition
資料庫書籍(Database Books)
Database Systems
Database Systems: A Practical Approach to Design, Implementation and Management (5th Edition)
Database Management Systems
User Interface Design for Mere Mortals™
Beginning Database Design
資料倉儲書籍(Data Warehousing Books)
Building the Data Warehouse
The Data Warehouse Lifecycle Toolkit
The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling
Mastering Data Warehouse Design: Relational and Dimensional Techniques
Data Warehouse and Business Information Quality
資料視覺化(Data visualization)
Visualizing Data
- 持續更新中.......
訂閱:
文章 (Atom)