CDA數據分析師出品
作者:Mika、澤龍
數據:真達
后期:澤龍
:今天我們來聊聊小朋友和大朋友們都愛不釋手的樂高,Python技術部分請看第四部分。Showmedata,用數據說話!
六一兒童節到了,過節的不僅僅是兒童,還有很多不想長大的成年人。然而,兒童游樂場不好意思去跟小朋友搶,幼兒園里已經沒有容身之地。這時,玩具可能是最后一件能讓成年人過把癮的方式了。
根據去年的天貓雙11數據統計:雙11玩具/童車/益智/積木品牌TOP20榜單中,在玩具領域,樂高位居首位,占據了1/5的市場份額,銷售額超過1138萬元,銷量達14712件,妥妥的玩具領域大佬。今天我們就用數據來聊一聊,小朋友和大朋友們都愛不釋手的樂高。
01、老少皆宜大IP聯名,玩具居然可以這么玩?!
1932年,樂高公司在丹麥成立。商標“LEGO”是來自丹麥語“LEgGOdt”,意為“playwell”。
在10年前,樂高真是家庭水準的體現,小時候能有個樂高玩具,應該是很多人的夢想,但是長大了發現,現在擁有樂高玩具,也是夢想。有多少人在疫情期間想在淘寶買樂高玩具,也來挑戰下千年隼75192,證明自己不再是手殘黨。
外國的樂高狂熱粉絲用樂高拼了一輛能開的跑車,真的可以以每小時15公里的速度前進,這也算是人類創造能力的體現,本身樂高提倡的就是自由組裝,playwell。創造力才是他們的核心,這也就證明了樂高從小孩玩具到創造力檢測儀的進化。
浙江大學蔡亮:區塊鏈價值絕不僅僅是技術層面創新和顛覆:10月13日,在第三屆數字中國建設峰會上,浙江大學區塊鏈研究中心常務副主任蔡亮表示,區塊鏈技術可以就構建資產互聯、價值互聯和信任互聯,區塊鏈價值絕不僅僅是技術層面創新和顛覆,分布式的信任機制一定會帶來組織管理模式的創新。(人民網)[2020/10/14]
如今的樂高就像玩具界的Supreme,時不時就弄出套聯名款,即使你不是樂高粉絲,也忍不住趕緊送上錢包。
之前,樂高就和暴雪合作推出了《樂高守望先鋒系列》。
《樂高星球大戰系列》,至今全球已經熱銷超過兩千萬套。其中“豪華千年隼”,更是被稱為“樂高史上最大套裝”。
從DC的蝙蝠俠到漫威的鋼鐵俠,熱門電影的熱度“能蹭就蹭”。
如果你是《哈利波特》迷,等不到送入學通知書的貓頭鷹?沒關系,樂高讓你直接把霍格沃茨買回家。
02、都是哪些人在玩樂高?
那么都是哪些人在玩樂高呢?我們用Python獲取“樂高中國”最新的三條微博(5.06日、5.08日、5.15日發布)后的評論和粉絲信息,分析粉絲畫像,數據共4815條。
粉絲性別占比
聲音 | PoS之父Sunny King:我們需要的不僅僅是貨幣 而是一個支持各種區塊鏈應用的經濟體系:PoS之父Sunny King于今日在與CMC創始人Brandon Chez對話中提到,其支持加密貨幣與比特幣進行整合的趨勢。他表示:“我們需要的不僅僅是貨幣,而是需要一個能夠支持各種區塊鏈應用的經濟體系,這也是我現在主導V SYSTEMS區塊鏈的初衷。基礎貨幣對于經濟的健康繁榮確實至關重要,但也僅是這個經濟體系中很小的一部分。比特幣是最早出現的加密貨幣,在技術的世界,比特幣的主導地位將不斷受到挑戰。比特幣的設計中存在風險因素,可能會在未來十到二十年內顯現,屆時比特幣的新的增量已經非常小了。因此作為基礎加密貨幣,比特幣可能無法長期占據主導地位,對于成千上萬的其他加密貨幣,大家要對它們寄予希望。”[2019/11/12]
首先看到樂高中國的微博粉絲性別占比,從數據可以看到,女性粉絲遠超男性,占比高達到65.23%,男性占比34.77%
粉絲數量地區分布
都是哪些地區的人最愛玩樂高呢?
從圖中可以看到,北上廣位居前三,海外的粉絲也不少,位居第四。之后就是江蘇、山東分別為第五和第六。
粉絲年齡分布
聲音 | BM:當你是一個受監管的個體時,你要遵守得不僅僅只是合規,你需要承擔更多:據MEET.ONE 報道,BM在電報群里發表了他對合規的看法:在BM看來,合規確實保護了人們,人們利用合規的法律效力預防競爭和管控公司。但是當你是一個受管制的個體時,你不僅僅要遵守合規,你還必須遵守一般政策或承擔許可證被撤銷和關閉的風險。簡而言之,你基本上不是真正地擁有自己的業務。[2019/6/15]
18-25歲的粉絲最多占比高達38.69%,其次就是25-30歲的了,占比為24.01%,30-40歲的占比19.97%。總體來說,樂高在國內的粉絲還是比較年輕化的,既有喜歡玩樂高的年輕玩家,也有熱衷給孩子買樂高玩的年輕父母。
微博評論詞云
下面我們看到“樂高中國”微博下面的評論詞云,可以看到提到最多的就是"樂高"。同時"齊天大圣"、"忍者神龜"等都是被提及最多的熱門款。
03、哪款樂高賣的最好?
下面我們用Python進一步分析樂高在天貓和淘寶全網的數據,我們共搜集整理了樂高在淘寶的商品數據,一共4404條商品信息。以及天貓樂高旗艦店一共392條的數據。
樂高銷量TOP10店鋪
首先看到淘寶全網樂高銷量店鋪的排名。不用說,樂高官方旗艦店是妥妥的第一位,其次天貓超市的位居第二。
樂高產地排名TOP10
聲音 | Joseph Lubin:區塊鏈不僅僅是市場 還是一場運動:以太坊聯合創始人Joseph Lubin最近發推稱,區塊鏈不僅僅是市場,還是一場運動。并表示,市值并不反映市場活動,區塊鏈分散網絡正在發展。
隨后,比特幣核心開發者Jimmy Song發推文@Joseph Lubin稱,有趣的是,Joseph Lubin一直在說這句話。但當我提出打來場賭局時,他同意了,然后拖了6個月才算完。直到他真的做到之前,都不要相信這個家伙說的話。[2018/12/3]
樂高產地方面,我們可以看到,廣東和上海是大頭,位居第一和第二。北京位居第三。
不同價格區間商品數量
樂高的定價如何呢?我們可以看到0-50元的樂高商品是最多的,達到895件。其次100-200元的也不少,以701件位居第二。1000元以上的資深玩家款最少,為260件。
不同價格區間的銷售額
這里就比較有意思了,1000元以上的銷售額占比達到32.24%,果然是人民幣玩家的專選。其次500-1000元的商品銷售額占比15.91%。緊接著較為平價的100-200元款,銷售額占比15.76%。
淘寶樂高商品標題詞云
下面看到淘寶樂高相關標題的詞云,"樂高"、"玩具"、"積木"都是提及最多的關鍵詞。同時"益智"、"系列"、"正品"等詞也是標題中常有的詞。
中國最大的IT社區創始人蔣濤:幣圈的作用不僅僅是炒幣,它是一種新型的協作手段:CSDN創始人&董事長蔣濤近日表示:關于區塊鏈的應用,從2015年開始,人們把比特幣的這種區塊鏈核心技術拿出來,希望從技術層面上去對各個行業的一些舊有機制創造一些新的應用,但是這些應用的進展并沒有想象的那么快。前幾年,基本上搞區塊鏈技術的人,大部分屬于鏈圈,他們關注區塊鏈技術能不能實際在行業里邊落地,能找到哪些場景落地。2017年出現了一個爆炸性的增長,使得我們需要重新去認知所謂幣圈的作用也不僅僅是炒幣,它是一種新型的協作手段,這是新的認知。未來5-10年,信息、物體之間彼此的溝通、確認、交易,將基于區塊鏈的技術來進行確權。通證系統加強了系統的流通性,對于每個做出真正貢獻的人,其價值將被更好的放大。[2018/1/29]
我們再具體看看哪款樂高產品賣得最好。
樂高旗艦店商品銷量TOP10
讓我們再看到樂高旗艦店的數據:
我們可以看到,孫悟空齊天大圣黃金機甲這款,以月銷量4765件位居榜首。
其次第二位是R賽車成人送禮收藏車模,月銷量2750件。然后云霄戰機孫悟空齊天大圣位居第三,月銷量達到2453件。
不同價格區間商品數量
在商品價格區間方面,可以看到數量最多的還是0-50元的平價款,共2082件商品,遠遠高于其他價格區間。其次50-100元的商品有495件。
不同價格區間銷售額
最后,我們再看到不同價格區間的銷售額:
這里與淘寶全網數據不同,銷售額占比最高的是0-50元的商品,占比49.21%。其次是50-100元,占比16.13%。而1000元以上的銷售額占比最少,僅為2.94%。這也說明,在購買1000元以上的收藏款時,大家更傾向于在其他渠道購買,而不是官方旗艦店。
樂高旗艦店商品標題詞云
我們再看看在樂高旗艦店,商品標題都有什么特點。可以看到標題中,"積木"、"玩具"、"XX系列"都被常常提到。同時"送禮"、"創意"、"益智"、"收藏"等也常出現。
04、帶你用Python分析樂高淘寶數據
我們使用Python分別獲取了淘寶上的樂高商品數據、樂高旗艦店的店鋪商品銷售數據和微博樂高中國的評論和粉絲數據,進行了數據分析分析。此處展示淘寶商品分析部分代碼。按照常規數據分析流程進行:
01數據讀入
首先導入所需的庫,并讀入采集的數據集。其中pandas用于數據整理、jieba用于分詞、pyecharts和stylecloud用于繪制可視化圖形。
Billions項目組讀入數據df_tb=pd.read_excel('../data/樂高淘寶數據.xlsx')df_tb.head()
查看一下數據框的大小,可以看到一共有4403個樣本。
df_tb.info()
<class'pandas.core.frame.DataFrame'>RangeIndex:4404entries,0to4403Datacolumns(total5columns):goods_name4404non-nullobjectshop_name4404non-nullobjectprice4404non-nullfloat64purchase_num4404non-nullobjectlocation4404non-nullobjectdtypes:float64(1),object(4)memoryusage:172.1+KB
02數據處理
此處我們對各個字段進行以下處理以方便后續的數據分析工作,經過去重之后一共有3411個樣本:
去除重復值goods_name:暫不處理shop_name:暫不處理price:暫不處理purchase_num:提取人數計算銷售額=price*purchase_numlocation:提取省份
Billions項目組刪除購買人數為空的記錄df_tb=df_tb.str.contains('人付款')]Billions項目組purchase_num處理df_tb=df_tb.str.extract('(\d+)').astype('int')Billions項目組locationdf_tb=df_tb.str.split('').strdf_tb.head()
03數據可視化
數據可視化部分主要對以下的信息進行匯總和可視化分析,分析維度和使用圖形如下:
樂高銷量排名top10店鋪-條形圖樂高產地數量排名top10-條形圖樂高產地國內銷量分布-地圖價格分布-餅圖不同價格區間的銷量表現-餅圖商品標題詞云圖-詞云圖
樂高銷量排名Top10淘寶店鋪-條形圖
shop_top10=df_tb.groupby('shop_name').sum().sort_values(ascending=False).head(10)Billions項目組地圖map1=Map(init_opts=opts.InitOpts(width='1350px',height='750px'))map1.add("",,maptype='china')map1.set_global_opts(title_opts=opts.TitleOpts(title='國內各產地樂高銷量分布圖'),visualmap_opts=opts.VisualMapOpts(max_=172277),)map1.render()
天貓樂高價格分布
Billions項目組餅圖bar3=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar3.add_xaxis()bar3.add_yaxis('',)bar3.set_global_opts(title_opts=opts.TitleOpts(title='不同價格區間的商品數量'),visualmap_opts=opts.VisualMapOpts(max_=900))bar3.render()
不同價格區間的銷售額整體表現
Billions項目組數據對data_pair=Billions項目組讀入停用詞表stop_words=Billions項目組添加關鍵詞my_words=foriinmy_words:jieba.add_word(i)Billions項目組條件篩選word_num_selected=return''.join(word_num_selected)Billions項目組繪制詞云圖stylecloud.gen_stylecloud(text,Billions項目組電腦字體路徑icon_name='fasfa-heart',Billions項目組繪圖尺寸output_name='淘寶樂高標題詞云圖.png'#輸出png文件)
最近一有時間,我就回去翻翻EOS的貼吧,看看在EOS上面都有哪些吐槽,同時也可以為自己療療傷,畢竟心被傷透了,但又不愿意割肉離場,就只能去找一些志同道合的朋友安慰下自己了.
1900/1/1 0:00:00記者|慕澤編輯|宋燁珺1廈門一哥,在游資圈里口碑很差。但這不影響他神話般的投資戰績。這位據傳清華大學畢業的高材生,從50萬元做到身家1.5億只用了不到兩年,期間收益率高達300倍.
1900/1/1 0:00:00黃金和比特幣到底是什么每個人對他們的看法都不盡相同,愛他們的人愛得死去活來,很他們的人恨得此恨綿綿無絕期.
1900/1/1 0:00:00在這個大智移云的時代,咱們的注冊管理會計師CMA考試也在與時俱進了,新版CMA考綱已經納入一個新的章節“科技與分析”,講的凈是些咱們財會人聽到過一點兒.
1900/1/1 0:00:00EOS這個項目大家都不陌生,曾經的明星項目,如今卻眾人踩。三天前師兄在文章里提到,EOS會被擠出市值前十,結果這兩天就出去了,雖然目前排名還沒穩定,但目前來看EOS的長期價值確實沒大家想象的那么.
1900/1/1 0:00:00最近以太坊的過山車行情玩的是越來越好了,從6月22號開始的一波上行,最高觸及249.2高點,然后承壓回落,再次回到之前的起漲點,在這波下行中行情一直維持震蕩下行.
1900/1/1 0:00:00