全國服務熱線:400-080-4418
(上海網絡優化)摘要:電子商務在現代商務活動中的正變得日趨重要,而商務數據的處理則凸顯出數據挖掘的重要。本文討論了數據挖掘的主要方法,具體闡述了數據挖掘技術在電子商務中的作用及應用。
一、概述(上海企業網站建設)
數據挖掘(Data Mining)起源于數據庫中的知識發現(Knowledge Discover in Database,KDD),是指從大型數據庫或數據倉庫中提取隱含的、未知的、非平凡且終可理解的及有潛在應用價值的信息或模式。數據挖掘技術是計算機技術發展的熱點之一。
通過對歷史積累的大量數據的有效挖掘,可以發現隱藏的規律或模式,為決策提供支持,而這些規律或模式是不能夠依靠簡單的數據查詢得到,或者是不能在可接受的時間內得到。這些規律或模式可以進一步在專業人員的識別下成為知識,并可以應用到以客戶為中心的企業決策分析和管理的各個不同領域和階段。
電子商務(E-Commerce)是以指利用電子數據交換(Electronic Data Interchange,EDI)、電子郵件(E-mail)、電子資金轉賬(Electronic Funds Transfer,EFT)和Internet等主要技術在個人、企業和國家之間進行無紙化的信息交換,包括商品信息及其訂購信息、資金信息及其支付信息、安全及其認證信息等,即以現代信息技術為手段,以經濟效益為中心的現代化商業運轉模式。其終目標是實現商務活動的網絡化、自動化與智能化。
隨著Internet的迅速發展,電子商務的應用不斷深入。在電子商務應用系統中,相關的用戶數據日益增多,數據挖掘技術具有從大量復雜數據中發現特定規律的能力。商業電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性。
二、數據挖掘的主要方法(上海網站建設)
數據挖掘融合了數據庫、人工智能、機器學習、統計學等多個領域的理論和技術。比較典型的數據挖掘方法有分類、關聯規則分析、聚類分析和孤立點分析等。
1.分類。分類是找出一個類別的概念描述,它代表了這類數據的整體信息,即該類的內涵描述,一般用規則或決策樹模式表示。實際上就是通過分析示例數據庫中的數據,為每個類別做出準確的描述或建立分析模型或挖掘出分類規則,然后用這個分類規則對其他數據庫中的記錄進行分類。
2關聯規則分析。關聯規則分析用于發現關聯規則。若兩個或多個數據項的取值重復出現且概率很高時,它就存在著某種關聯,可以建立起這些數據項的關聯規則,一般用“支持度”和“置信度”兩個閩值來淘汰那些無用的關聯規則。關聯規則分析能發現數據庫中諸如“90%的顧客在一次購買活動中購買商品A的同時購買商品B”之類的特征。
3.聚類分析。聚類分析的對象是一組未分類記錄,并且這些記錄應分成幾類事先也不知道。聚類就是通過分析數據庫中的記錄數據,根據一定的分類規則,合理地劃分記錄集合,確定每個記錄所在類別。它所采用的分類規則是由聚類分析工具決定的。采用不同的聚類方法,對于相同的記錄集合可能有不同的劃分結果。
4.孤立點分析。數據庫中的數據常有一些異常記錄,這些記錄稱為孤立點,常常包括很多潛在的知識,如分類中的反常實例、不滿足規則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。孤立點分析基本方法是尋找觀測結果與參照之間的差別。
三、據據挖掘在的應用(上海做網站)
數據挖掘的應用十分廣泛,如銀行、電信、保險、交通、零售(如超級市場)等領域。數據挖掘所能解決的典型商業問題包括數據庫營銷(Database Marketing)、客戶群體劃分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉銷售(Cross-selling)等市場分析行為,以及客戶流失性分析(Churn Analysis)、客戶信用記分(Credit Scoring)和欺詐發現(Fraud Detection)等。[Page]
分類的目的是構造一個分類函數或分類模型,通常稱作分類器。分類器的構造方法通常由統計方法、機器學習方法、神經網絡方法等。在金融領域,管理者可以通過對客戶償還能力以及信用的分析,進行分類,評出等級,減少放貸的盲目性,提高資金的使用效率。
在零售業,數據挖掘可有助于識別顧客購買行為,發現顧客購買模式和趨勢,改進服務質量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設計更好的貨品運輸與分銷策略,減少商業成本。
電信、計算機網絡、因特網和各種其它方式的通信和計算的融合是目前的大勢所趨。利用數據挖掘技術來幫助理解商業行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務質量是非常有必要的,通過挖掘進行盜用模式分析和異常模式識別,從而可盡早發現盜用,為公司減少損失。數據挖掘是一個非常復雜的過程。每一種數據挖掘技術方法都有其自身的特點和實現步驟。每種數據挖掘的技術方法對輸入/輸出數據形式的要求、結構、參數設置、訓練、測試和模型評價方式各自有不同的要求,算法應用領域的含義和能力也存在差異。數據挖掘過程一般分為定義問題、準備數據、實施挖掘、評價與表示等幾個階段。數據挖掘過程的這幾個階段都需要人的參與指導。(企業網站建設)
四、結束語
數據挖掘是指按企業既定業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,并進一步將其模型化的先進有效的方法。電子商務是現代信息技術發展的必然結果,也是未來商業運作模式的必然選擇。企業數據量日益龐大,其中真正有價值的信息卻很少,利用數據挖掘技術,從大量的數據中經過深層分析,獲得有利于商業運作、提高競爭力的信息,發揮企業的獨特優勢,促進管理創新和技術創新。(企業網站建設)
Copyright 2008 © 上海網至普信息科技有限公司 All rights reserved. 滬ICP備11006570號-13 滬公網安備 31011402007386號