{ "cells": [ { "cell_type": "markdown", "metadata": { "toc": "true" }, "source": [ "# Table of Contents\n", "

1  将数据进行初步整理
1.1  Year 2007
1.2  Year 2008
1.3  Year 2009
1.4  Year 2010
" ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "collapsed": false }, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns\n", "\n", "% matplotlib inline" ] }, { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "# 将数据进行初步整理" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Year 2007" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 2007年的数据,原始数据的单位为十亿美元" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "collapsed": false, "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "the shape of DataFrame: (2000, 9)\n", "年份 int64\n", "排名(Rank) int64\n", "公司名称(Company) object\n", "所在国家或地区(Country) object\n", "所在行业(Industry) object\n", "销售收入(Sales) object\n", "利润(Profits) object\n", "总资产(Assets) object\n", "市值(Market Vaue) float64\n", "dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
年份排名(Rank)公司名称(Company)所在国家或地区(Country)所在行业(Industry)销售收入(Sales)利润(Profits)总资产(Assets)市值(Market Vaue)
020071Citigroup /花旗集团美国(US)银行146.5621.541,884.32247.42
120072Bank of America /美国银行美国(US)银行116.5721.131,459.74226.61
220073HSBC Holdings/汇丰集团英国(UK)银行121.5116.631,860.76202.29
\n", "
" ], "text/plain": [ " 年份 排名(Rank) 公司名称(Company) 所在国家或地区(Country) 所在行业(Industry) \\\n", "0 2007 1 Citigroup /花旗集团 美国(US) 银行 \n", "1 2007 2 Bank of America /美国银行 美国(US) 银行 \n", "2 2007 3 HSBC Holdings/汇丰集团 英国(UK) 银行 \n", "\n", " 销售收入(Sales) 利润(Profits) 总资产(Assets) 市值(Market Vaue) \n", "0 146.56 21.54 1,884.32 247.42 \n", "1 116.57 21.13 1,459.74 226.61 \n", "2 121.51 16.63 1,860.76 202.29 " ] }, "execution_count": 2, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007 = pd.read_csv('./data/data_forbes_2007.csv', encoding='gbk', thousands=',')\n", "print('the shape of DataFrame: ', df_2007.shape)\n", "print(df_2007.dtypes)\n", "df_2007.head(3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 更新columns的命名" ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
020071Citigroup /花旗集团美国(US)银行146.5621.541,884.32247.42
120072Bank of America /美国银行美国(US)银行116.5721.131,459.74226.61
220073HSBC Holdings/汇丰集团英国(UK)银行121.5116.631,860.76202.29
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "0 2007 1 Citigroup /花旗集团 美国(US) 银行 146.56 \n", "1 2007 2 Bank of America /美国银行 美国(US) 银行 116.57 \n", "2 2007 3 HSBC Holdings/汇丰集团 英国(UK) 银行 121.51 \n", "\n", " Profits Assets Market_value \n", "0 21.54 1,884.32 247.42 \n", "1 21.13 1,459.74 226.61 \n", "2 16.63 1,860.76 202.29 " ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "column_update = ['Year', 'Rank', 'Company_cn_en', 'Country_cn_en', \n", " 'Industry_cn', 'Sales', 'Profits', 'Assets', 'Market_value']\n", "df_2007.columns = column_update\n", "df_2007.head(3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **通过前面的分析可看出,只有“Market_value”是数字类型,找出'Sales','Profits'及'Assets'中非数字的内容**" ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
1172007118Repsol-YPF /瑞普索西班牙(SP)炼油64.20 E4.1258.4338.75
6162007617Inpex Holdings日本(JA)炼油6.49 E1.02 E10.77 E19.65
8802007881Asahi Breweries/朝日啤酒日本(JA)食品、饮料和烟草7.97 E0.3810.667.71
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "117 2007 118 Repsol-YPF /瑞普索 西班牙(SP) 炼油 64.20 E \n", "616 2007 617 Inpex Holdings 日本(JA) 炼油 6.49 E \n", "880 2007 881 Asahi Breweries/朝日啤酒 日本(JA) 食品、饮料和烟草 7.97 E \n", "\n", " Profits Assets Market_value \n", "117 4.12 58.43 38.75 \n", "616 1.02 E 10.77 E 19.65 \n", "880 0.38 10.66 7.71 " ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007[df_2007['Sales'].str.contains('.*[A-Za-z]', regex=True)]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 用replace()方法替换“Sales”列中含有字母的内容" ] }, { "cell_type": "code", "execution_count": 5, "metadata": { "collapsed": false, "scrolled": true }, "outputs": [], "source": [ "df_2007['Sales'] = df_2007['Sales'].replace('([A-Za-z])', '', regex=True)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 查看替换后的结果" ] }, { "cell_type": "code", "execution_count": 6, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
1172007118Repsol-YPF /瑞普索西班牙(SP)炼油64.204.1258.4338.75
6162007617Inpex Holdings日本(JA)炼油6.491.02 E10.77 E19.65
8802007881Asahi Breweries/朝日啤酒日本(JA)食品、饮料和烟草7.970.3810.667.71
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "117 2007 118 Repsol-YPF /瑞普索 西班牙(SP) 炼油 64.20 \n", "616 2007 617 Inpex Holdings 日本(JA) 炼油 6.49 \n", "880 2007 881 Asahi Breweries/朝日啤酒 日本(JA) 食品、饮料和烟草 7.97 \n", "\n", " Profits Assets Market_value \n", "117 4.12 58.43 38.75 \n", "616 1.02 E 10.77 E 19.65 \n", "880 0.38 10.66 7.71 " ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007.loc[[117,616,880], :]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **查看“Assets”列中非数字的内容**" ] }, { "cell_type": "code", "execution_count": 7, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
6162007617Inpex Holdings日本(JA)炼油6.491.02 E10.77 E19.65
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales Profits \\\n", "616 2007 617 Inpex Holdings 日本(JA) 炼油 6.49 1.02 E \n", "\n", " Assets Market_value \n", "616 10.77 E 19.65 " ] }, "execution_count": 7, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007[df_2007['Assets'].str.contains('.*[A-Za-z]', regex=True)]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 替换非数字的内容,以及替换千分位间隔符号" ] }, { "cell_type": "code", "execution_count": 8, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/plain": [ "Year 2007\n", "Rank 617\n", "Company_cn_en Inpex Holdings\n", "Country_cn_en 日本(JA)\n", "Industry_cn 炼油\n", "Sales 6.49 \n", "Profits 1.02 E\n", "Assets 10.77 \n", "Market_value 19.65\n", "Name: 616, dtype: object" ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# 将数字后面的字母进行替换\n", "df_2007['Assets'] = df_2007['Assets'].replace('([A-Za-z])', '', regex=True)\n", "\n", "# 千分位数字的逗号被识别为string了,需要替换\n", "df_2007['Assets'] = df_2007['Assets'].replace(',', '', regex=True)\n", "df_2007.loc[616, :]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **发现“Profits”中有NaN值,需要先进行替换**" ] }, { "cell_type": "code", "execution_count": 9, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
9582007959UAL/美国联合航空公司美国(US)运输19.34NaN25.864.43
144020071441Owens Corning/欧文斯科宁美国(US)建筑6.46NaN8.474.19
154420071545Parmalat/帕玛拉特公司意大利(IT)食品、饮料和烟草4.83NaN4.907.02
191220071912Winn-Dixie Stores美国(US)食品市场6.96NaN1.621.05
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "958 2007 959 UAL/美国联合航空公司 美国(US) 运输 19.34 \n", "1440 2007 1441 Owens Corning/欧文斯科宁 美国(US) 建筑 6.46 \n", "1544 2007 1545 Parmalat/帕玛拉特公司 意大利(IT) 食品、饮料和烟草 4.83 \n", "1912 2007 1912 Winn-Dixie Stores 美国(US) 食品市场 6.96 \n", "\n", " Profits Assets Market_value \n", "958 NaN 25.86 4.43 \n", "1440 NaN 8.47 4.19 \n", "1544 NaN 4.90 7.02 \n", "1912 NaN 1.62 1.05 " ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007[pd.isnull(df_2007['Profits'])]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 将NaN值填充为 0" ] }, { "cell_type": "code", "execution_count": 10, "metadata": { "collapsed": false, "scrolled": true }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
9582007959UAL/美国联合航空公司美国(US)运输19.34025.864.43
144020071441Owens Corning/欧文斯科宁美国(US)建筑6.4608.474.19
154420071545Parmalat/帕玛拉特公司意大利(IT)食品、饮料和烟草4.8304.907.02
191220071912Winn-Dixie Stores美国(US)食品市场6.9601.621.05
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "958 2007 959 UAL/美国联合航空公司 美国(US) 运输 19.34 \n", "1440 2007 1441 Owens Corning/欧文斯科宁 美国(US) 建筑 6.46 \n", "1544 2007 1545 Parmalat/帕玛拉特公司 意大利(IT) 食品、饮料和烟草 4.83 \n", "1912 2007 1912 Winn-Dixie Stores 美国(US) 食品市场 6.96 \n", "\n", " Profits Assets Market_value \n", "958 0 25.86 4.43 \n", "1440 0 8.47 4.19 \n", "1544 0 4.90 7.02 \n", "1912 0 1.62 1.05 " ] }, "execution_count": 10, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007['Profits'].fillna(0, inplace=True)\n", "df_2007.loc[[958,1440,1544,1912], :]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 将“Profits”列中非数字的内容进行替换,并查看替换后的结果" ] }, { "cell_type": "code", "execution_count": 11, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_value
1172007118Repsol-YPF /瑞普索西班牙(SP)炼油64.204.1258.4338.75
6162007617Inpex Holdings日本(JA)炼油6.491.0210.7719.65
8802007881Asahi Breweries/朝日啤酒日本(JA)食品、饮料和烟草7.970.3810.667.71
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "117 2007 118 Repsol-YPF /瑞普索 西班牙(SP) 炼油 64.20 \n", "616 2007 617 Inpex Holdings 日本(JA) 炼油 6.49 \n", "880 2007 881 Asahi Breweries/朝日啤酒 日本(JA) 食品、饮料和烟草 7.97 \n", "\n", " Profits Assets Market_value \n", "117 4.12 58.43 38.75 \n", "616 1.02 10.77 19.65 \n", "880 0.38 10.66 7.71 " ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007['Profits'] = df_2007['Profits'].replace('([A-Za-z])', '', regex=True)\n", "df_2007.loc[[117,616,880], :]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **将sting类型的数字转换为数据类型,这里使用 pd.to_numeric() 方法**" ] }, { "cell_type": "code", "execution_count": 12, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/plain": [ "Year int64\n", "Rank int64\n", "Company_cn_en object\n", "Country_cn_en object\n", "Industry_cn object\n", "Sales float64\n", "Profits float64\n", "Assets float64\n", "Market_value float64\n", "dtype: object" ] }, "execution_count": 12, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007['Sales'] = pd.to_numeric(df_2007['Sales'])\n", "df_2007['Profits'] = pd.to_numeric(df_2007['Profits'])\n", "df_2007['Assets'] = pd.to_numeric(df_2007['Assets'])\n", "df_2007.dtypes" ] }, { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "* **拆分\"Company_cn_en\"列**,新生成两列,分别为公司英文名称和中文名称" ] }, { "cell_type": "code", "execution_count": 13, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 Citigroup \n", "1 Bank of America \n", "2 HSBC Holdings\n", "3 General Electric \n", "4 JPMorgan Chase \n", "Name: Company_en, dtype: object\n", "1995 NaN\n", "1996 NaN\n", "1997 NaN\n", "1998 NaN\n", "1999 NaN\n", "Name: Company_cn, dtype: object\n" ] } ], "source": [ "df_2007['Company_en'],df_2007['Company_cn'] = df_2007['Company_cn_en'].str.split('/', 1).str\n", "print(df_2007['Company_en'][:5])\n", "print(df_2007['Company_cn'] [-5:])" ] }, { "cell_type": "code", "execution_count": 14, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_valueCompany_enCompany_cn
199720071998CBOT Holdings美国(US)综合金融0.640.170.818.54CBOT HoldingsNaN
199820071998Singapore Petroleum新加坡(SI)炼油5.590.192.051.50Singapore PetroleumNaN
199920072000DVB Bank德国(GE)银行0.770.0612.741.26DVB BankNaN
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "1997 2007 1998 CBOT Holdings 美国(US) 综合金融 0.64 \n", "1998 2007 1998 Singapore Petroleum 新加坡(SI) 炼油 5.59 \n", "1999 2007 2000 DVB Bank 德国(GE) 银行 0.77 \n", "\n", " Profits Assets Market_value Company_en Company_cn \n", "1997 0.17 0.81 8.54 CBOT Holdings NaN \n", "1998 0.19 2.05 1.50 Singapore Petroleum NaN \n", "1999 0.06 12.74 1.26 DVB Bank NaN " ] }, "execution_count": 14, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007.tail(3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **拆分\"Country_cn_en\"列**,新生成两列,分别为国家中文名称和英文名称" ] }, { "cell_type": "code", "execution_count": 15, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 美国\n", "1 美国\n", "2 英国\n", "3 美国\n", "4 美国\n", "Name: Country_cn, dtype: object\n", "1995 US)\n", "1996 US)\n", "1997 US)\n", "1998 SI)\n", "1999 GE)\n", "Name: Country_en, dtype: object\n" ] } ], "source": [ "df_2007['Country_cn'],df_2007['Country_en'] = df_2007['Country_cn_en'].str.split('(', 1).str\n", "print(df_2007['Country_cn'][:5])\n", "print(df_2007['Country_en'][-5:])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 由于国家的英文名称中,最后有半个括号,需要去除,用 Series.str.slice()方法\n", "* 参数表示选取从开始到倒数第二个,即不要括号\")\"" ] }, { "cell_type": "code", "execution_count": 16, "metadata": { "collapsed": false, "scrolled": true }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_valueCompany_enCompany_cnCountry_cnCountry_en
020071Citigroup /花旗集团美国(US)银行146.5621.541884.32247.42Citigroup花旗集团美国US
120072Bank of America /美国银行美国(US)银行116.5721.131459.74226.61Bank of America美国银行美国US
220073HSBC Holdings/汇丰集团英国(UK)银行121.5116.631860.76202.29HSBC Holdings汇丰集团英国UK
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "0 2007 1 Citigroup /花旗集团 美国(US) 银行 146.56 \n", "1 2007 2 Bank of America /美国银行 美国(US) 银行 116.57 \n", "2 2007 3 HSBC Holdings/汇丰集团 英国(UK) 银行 121.51 \n", "\n", " Profits Assets Market_value Company_en Company_cn Country_cn \\\n", "0 21.54 1884.32 247.42 Citigroup 花旗集团 美国 \n", "1 21.13 1459.74 226.61 Bank of America 美国银行 美国 \n", "2 16.63 1860.76 202.29 HSBC Holdings 汇丰集团 英国 \n", "\n", " Country_en \n", "0 US \n", "1 US \n", "2 UK " ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007['Country_en'] = df_2007['Country_en'].str.slice(0,-1)\n", "df_2007.head(3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 考虑的中国的企业有区分为中国大陆,中国香港,中国台湾\n", "* 对应的国家英文名称也需要修改下\n", "* 中国大陆:CN;中国香港:CN-HK;中国台湾:CN-TA" ] }, { "cell_type": "code", "execution_count": 17, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_valueCompany_enCompany_cnCountry_cnCountry_en
40200741PetroChina /中国石油中国大陆(CN)炼油68.4316.5396.42208.76PetroChina中国石油中国大陆CN
52200753ICBC /中国工商银行中国大陆(CN)银行31.984.65800.04176.03ICBC中国工商银行中国大陆CN
68200769CCB-China Construction Bank /中国建设银行中国大陆(CN)银行23.185.84568.21126.55CCB-China Construction Bank中国建设银行中国大陆CN
70200771Sinopec-China Petroleum /中石化中国大陆(CN)炼油99.035.0765.8393.57Sinopec-China Petroleum中石化中国大陆CN
81200782Bank of China /中国银行中国大陆(CN)银行23.103.41585.55143.80Bank of China中国银行中国大陆CN
88200789China Mobile /中国移动中国香港(HK)/中国大陆(CN)电信运营商29.796.5651.35185.31China Mobile中国移动中国香港HK)/中国大陆(CN
1752007176Hutchison Whampoa/和记黄埔中国香港(HK)/中国大陆(CN)多元化23.551.8574.9740.57Hutchison Whampoa和记黄埔中国香港HK)/中国大陆(CN
1802007181China Telecom/中国电信中国大陆(CN)电信运营商20.983.4650.3437.50China Telecom中国电信中国大陆CN
2422007243China Life Insurance /中国人寿中国大陆(CN)保险11.181.1569.30109.96China Life Insurance中国人寿中国大陆CN
3072007308Bank of Communications/中国交通银行中国大陆(CN)银行6.641.15176.2746.14Bank of Communications中国交通银行中国大陆CN
3092007310Taiwan Semiconductor/台积电中国台湾(TA)半导体9.743.9018.0254.32Taiwan Semiconductor台积电中国台湾TA
3402007341Hon Hai Precision Ind /鸿海精密中国台湾(TA)技术硬件和装备27.781.2413.9934.83Hon Hai Precision Ind鸿海精密中国台湾TA
3652007366Baoshan Iron & Steel /上海宝钢集团中国大陆(CN)材料15.631.5717.5921.42Baoshan Iron & Steel上海宝钢集团中国大陆CN
3882007389Cathay Financial/国泰金融中国台湾(TA)保险10.090.6693.2919.87Cathay Financial国泰金融中国台湾TA
3942007395Cnooc /中海油中国香港(HK)/中国大陆(CN)炼油8.513.1014.2234.94Cnooc中海油中国香港HK)/中国大陆(CN
4002007401China Netcom Group /中国网通中国香港(HK)/中国大陆(CN)电信运营商10.691.7024.7015.70China Netcom Group中国网通中国香港HK)/中国大陆(CN
4222007423China Shenhua Energy/中国神华能源股份有限公司中国大陆(CN)材料6.471.9417.0845.94China Shenhua Energy中国神华能源股份有限公司中国大陆CN
4292007430BOC Hong Kong/中银香港中国香港(HK)/中国大陆(CN)银行4.131.74106.0325.58BOC Hong Kong中银香港中国香港HK)/中国大陆(CN
4362007437Formosa Petrochemical/台塑石化中国台湾(TA)炼油13.561.7412.3519.28Formosa Petrochemical台塑石化中国台湾TA
4392007440Ping An Insurance Group/平安保险中国大陆(CN)保险7.950.5239.6239.60Ping An Insurance Group平安保险中国大陆CN
4512007452Jardine Matheson/香港怡和集团中国香港(HK)/中国大陆(CN)食品市场11.961.2518.3413.59Jardine Matheson香港怡和集团中国香港HK)/中国大陆(CN
5102007511Sun Hung Kai Properties /新鸿基房地产中国香港(HK)/中国大陆(CN)综合金融3.302.5629.7229.49Sun Hung Kai Properties新鸿基房地产中国香港HK)/中国大陆(CN
5412007542China Unicom /中国联通中国香港(HK)/中国大陆(CN)电信运营商10.670.6017.6316.03China Unicom中国联通中国香港HK)/中国大陆(CN
5512007552CLP Holdings /中电控股中国香港(HK)/中国大陆(CN)公用事业5.871.2716.4217.65CLP Holdings中电控股中国香港HK)/中国大陆(CN
5752007576Chunghwa Telecom/中华电信中国台湾(TA)电信运营商5.591.4513.9818.22Chunghwa Telecom中华电信中国台湾TA
6002007601China Steel/台湾中钢公司中国台湾(TA)材料8.661.5410.3512.24China Steel台湾中钢公司中国台湾TA
6032007604China Merchants Bank/招商银行中国大陆(CN)银行3.530.4690.7633.19China Merchants Bank招商银行中国大陆CN
6172007617Nan Ya Plastic/南亚塑胶工业中国台湾(TA)化学制品7.641.2211.4713.37Nan Ya Plastic南亚塑胶工业中国台湾TA
6272007628Cheung Kong/长江集团中国香港(HK)/中国大陆(CN)综合金融0.801.8028.0128.39Cheung Kong长江集团中国香港HK)/中国大陆(CN
7362007737Swire Pacific /太古集团中国香港(HK)/中国大陆(CN)多元化2.442.4216.0517.32Swire Pacific太古集团中国香港HK)/中国大陆(CN
..........................................
163620071637Champion REIT中国香港(HK)/中国大陆(CN)综合金融0.051.162.951.54Champion REITNaN中国香港HK)/中国大陆(CN
164120071642Noble Group中国香港(HK)/中国大陆(CN)运输13.750.133.812.14Noble GroupNaN中国香港HK)/中国大陆(CN
166120071662Taiwan Mobile中国台湾(TA)电信运营商1.810.503.594.84Taiwan MobileNaN中国台湾TA
168120071682Evergreen Marine中国台湾(TA)运输4.290.373.961.90Evergreen MarineNaN中国台湾TA
169220071693China Southern Airlines中国大陆(CN)运输4.64-0.238.841.97China Southern AirlinesNaN中国大陆CN
170520071706Cosco Pacific中国香港(HK)/中国大陆(CN)运输0.300.342.855.94Cosco PacificNaN中国香港HK)/中国大陆(CN
171020071711China Shipping Container中国大陆(CN)运输3.520.443.592.26China Shipping ContainerNaN中国大陆CN
173620071737China Resources Power Holdings中国香港(HK)/中国大陆(CN)公用事业0.760.373.675.37China Resources Power HoldingsNaN中国香港HK)/中国大陆(CN
173920071740Citic Securities中国大陆(CN)综合金融0.140.042.5214.29Citic SecuritiesNaN中国大陆CN
178020071781Far EasTone Telecom中国台湾(TA)电信运营商2.190.453.014.45Far EasTone TelecomNaN中国台湾TA
178620071787E.Sun Financial中国台湾(TA)银行0.730.1419.362.19E.Sun FinancialNaN中国台湾TA
182420071825Minmetals Development中国大陆(CN)贸易公司8.250.043.461.50Minmetals DevelopmentNaN中国大陆CN
184020071841Shanghai Automotive中国大陆(CN)耐用消费品0.790.141.8111.10Shanghai AutomotiveNaN中国大陆CN
184620071847HK Exchanges & Clearing中国香港(HK)/中国大陆(CN)综合金融0.350.172.9610.97HK Exchanges & ClearingNaN中国香港HK)/中国大陆(CN
185220071853Link REIT中国香港(HK)/中国大陆(CN)综合金融0.430.275.245.00Link REITNaN中国香港HK)/中国大陆(CN
186020071861Kweichow Moutai中国大陆(CN)食品、饮料和烟草0.430.141.0010.69Kweichow MoutaiNaN中国大陆CN
189220071892Yanzhou Coal Mining中国大陆(CN)材料1.430.362.634.52Yanzhou Coal MiningNaN中国大陆CN
190820071909China Shipping Develop中国大陆(CN)运输1.060.331.664.61China Shipping DevelopNaN中国大陆CN
192020071920Wing Lung Bank中国香港(HK)/中国大陆(CN)银行0.660.2110.922.43Wing Lung BankNaN中国香港HK)/中国大陆(CN
192220071923Delta Electronics中国台湾(TA)技术硬件和装备2.460.232.496.40Delta ElectronicsNaN中国台湾TA
194520071946China Airlines中国台湾(TA)运输3.610.027.631.85China AirlinesNaN中国台湾TA
194820071949Wing Hang Bank中国香港(HK)/中国大陆(CN)银行0.660.1713.453.33Wing Hang BankNaN中国香港HK)/中国大陆(CN
195920071959PCCW中国香港(HK)/中国大陆(CN)电信运营商2.900.216.873.98PCCWNaN中国香港HK)/中国大陆(CN
196020071961Benq中国台湾(TA)技术硬件和装备5.39-0.165.041.27BenqNaN中国台湾TA
196320071964TCL Corp中国大陆(CN)技术硬件和装备6.40-0.043.771.39TCL CorpNaN中国大陆CN
197020071971Wuliangye Yibin中国大陆(CN)食品、饮料和烟草0.700.101.198.81Wuliangye YibinNaN中国大陆CN
197320071974CNPC (Hong Kong)中国香港(HK)/中国大陆(CN)炼油0.440.472.072.30CNPC (Hong Kong)NaN中国香港HK)/中国大陆(CN
197520071976K Wah International中国香港(HK)/中国大陆(CN)综合金融0.040.471.290.98K Wah InternationalNaN中国香港HK)/中国大陆(CN
198620071987China Overseas Land & Inv中国香港(HK)/中国大陆(CN)综合金融0.900.203.247.05China Overseas Land & InvNaN中国香港HK)/中国大陆(CN
198920071989Nine Dragons Paper Holdings中国香港(HK)/中国大陆(CN)材料0.990.171.868.61Nine Dragons Paper HoldingsNaN中国香港HK)/中国大陆(CN
\n", "

131 rows × 13 columns

\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en \\\n", "40 2007 41 PetroChina /中国石油 中国大陆(CN) \n", "52 2007 53 ICBC /中国工商银行 中国大陆(CN) \n", "68 2007 69 CCB-China Construction Bank /中国建设银行 中国大陆(CN) \n", "70 2007 71 Sinopec-China Petroleum /中石化 中国大陆(CN) \n", "81 2007 82 Bank of China /中国银行 中国大陆(CN) \n", "88 2007 89 China Mobile /中国移动 中国香港(HK)/中国大陆(CN) \n", "175 2007 176 Hutchison Whampoa/和记黄埔 中国香港(HK)/中国大陆(CN) \n", "180 2007 181 China Telecom/中国电信 中国大陆(CN) \n", "242 2007 243 China Life Insurance /中国人寿 中国大陆(CN) \n", "307 2007 308 Bank of Communications/中国交通银行 中国大陆(CN) \n", "309 2007 310 Taiwan Semiconductor/台积电 中国台湾(TA) \n", "340 2007 341 Hon Hai Precision Ind /鸿海精密 中国台湾(TA) \n", "365 2007 366 Baoshan Iron & Steel /上海宝钢集团 中国大陆(CN) \n", "388 2007 389 Cathay Financial/国泰金融 中国台湾(TA) \n", "394 2007 395 Cnooc /中海油 中国香港(HK)/中国大陆(CN) \n", "400 2007 401 China Netcom Group /中国网通 中国香港(HK)/中国大陆(CN) \n", "422 2007 423 China Shenhua Energy/中国神华能源股份有限公司 中国大陆(CN) \n", "429 2007 430 BOC Hong Kong/中银香港 中国香港(HK)/中国大陆(CN) \n", "436 2007 437 Formosa Petrochemical/台塑石化 中国台湾(TA) \n", "439 2007 440 Ping An Insurance Group/平安保险 中国大陆(CN) \n", "451 2007 452 Jardine Matheson/香港怡和集团 中国香港(HK)/中国大陆(CN) \n", "510 2007 511 Sun Hung Kai Properties /新鸿基房地产 中国香港(HK)/中国大陆(CN) \n", "541 2007 542 China Unicom /中国联通 中国香港(HK)/中国大陆(CN) \n", "551 2007 552 CLP Holdings /中电控股 中国香港(HK)/中国大陆(CN) \n", "575 2007 576 Chunghwa Telecom/中华电信 中国台湾(TA) \n", "600 2007 601 China Steel/台湾中钢公司 中国台湾(TA) \n", "603 2007 604 China Merchants Bank/招商银行 中国大陆(CN) \n", "617 2007 617 Nan Ya Plastic/南亚塑胶工业 中国台湾(TA) \n", "627 2007 628 Cheung Kong/长江集团 中国香港(HK)/中国大陆(CN) \n", "736 2007 737 Swire Pacific /太古集团 中国香港(HK)/中国大陆(CN) \n", "... ... ... ... ... \n", "1636 2007 1637 Champion REIT 中国香港(HK)/中国大陆(CN) \n", "1641 2007 1642 Noble Group 中国香港(HK)/中国大陆(CN) \n", "1661 2007 1662 Taiwan Mobile 中国台湾(TA) \n", "1681 2007 1682 Evergreen Marine 中国台湾(TA) \n", "1692 2007 1693 China Southern Airlines 中国大陆(CN) \n", "1705 2007 1706 Cosco Pacific 中国香港(HK)/中国大陆(CN) \n", "1710 2007 1711 China Shipping Container 中国大陆(CN) \n", "1736 2007 1737 China Resources Power Holdings 中国香港(HK)/中国大陆(CN) \n", "1739 2007 1740 Citic Securities 中国大陆(CN) \n", "1780 2007 1781 Far EasTone Telecom 中国台湾(TA) \n", "1786 2007 1787 E.Sun Financial 中国台湾(TA) \n", "1824 2007 1825 Minmetals Development 中国大陆(CN) \n", "1840 2007 1841 Shanghai Automotive 中国大陆(CN) \n", "1846 2007 1847 HK Exchanges & Clearing 中国香港(HK)/中国大陆(CN) \n", "1852 2007 1853 Link REIT 中国香港(HK)/中国大陆(CN) \n", "1860 2007 1861 Kweichow Moutai 中国大陆(CN) \n", "1892 2007 1892 Yanzhou Coal Mining 中国大陆(CN) \n", "1908 2007 1909 China Shipping Develop 中国大陆(CN) \n", "1920 2007 1920 Wing Lung Bank 中国香港(HK)/中国大陆(CN) \n", "1922 2007 1923 Delta Electronics 中国台湾(TA) \n", "1945 2007 1946 China Airlines 中国台湾(TA) \n", "1948 2007 1949 Wing Hang Bank 中国香港(HK)/中国大陆(CN) \n", "1959 2007 1959 PCCW 中国香港(HK)/中国大陆(CN) \n", "1960 2007 1961 Benq 中国台湾(TA) \n", "1963 2007 1964 TCL Corp 中国大陆(CN) \n", "1970 2007 1971 Wuliangye Yibin 中国大陆(CN) \n", "1973 2007 1974 CNPC (Hong Kong) 中国香港(HK)/中国大陆(CN) \n", "1975 2007 1976 K Wah International 中国香港(HK)/中国大陆(CN) \n", "1986 2007 1987 China Overseas Land & Inv 中国香港(HK)/中国大陆(CN) \n", "1989 2007 1989 Nine Dragons Paper Holdings 中国香港(HK)/中国大陆(CN) \n", "\n", " Industry_cn Sales Profits Assets Market_value \\\n", "40 炼油 68.43 16.53 96.42 208.76 \n", "52 银行 31.98 4.65 800.04 176.03 \n", "68 银行 23.18 5.84 568.21 126.55 \n", "70 炼油 99.03 5.07 65.83 93.57 \n", "81 银行 23.10 3.41 585.55 143.80 \n", "88 电信运营商 29.79 6.56 51.35 185.31 \n", "175 多元化 23.55 1.85 74.97 40.57 \n", "180 电信运营商 20.98 3.46 50.34 37.50 \n", "242 保险 11.18 1.15 69.30 109.96 \n", "307 银行 6.64 1.15 176.27 46.14 \n", "309 半导体 9.74 3.90 18.02 54.32 \n", "340 技术硬件和装备 27.78 1.24 13.99 34.83 \n", "365 材料 15.63 1.57 17.59 21.42 \n", "388 保险 10.09 0.66 93.29 19.87 \n", "394 炼油 8.51 3.10 14.22 34.94 \n", "400 电信运营商 10.69 1.70 24.70 15.70 \n", "422 材料 6.47 1.94 17.08 45.94 \n", "429 银行 4.13 1.74 106.03 25.58 \n", "436 炼油 13.56 1.74 12.35 19.28 \n", "439 保险 7.95 0.52 39.62 39.60 \n", "451 食品市场 11.96 1.25 18.34 13.59 \n", "510 综合金融 3.30 2.56 29.72 29.49 \n", "541 电信运营商 10.67 0.60 17.63 16.03 \n", "551 公用事业 5.87 1.27 16.42 17.65 \n", "575 电信运营商 5.59 1.45 13.98 18.22 \n", "600 材料 8.66 1.54 10.35 12.24 \n", "603 银行 3.53 0.46 90.76 33.19 \n", "617 化学制品 7.64 1.22 11.47 13.37 \n", "627 综合金融 0.80 1.80 28.01 28.39 \n", "736 多元化 2.44 2.42 16.05 17.32 \n", "... ... ... ... ... ... \n", "1636 综合金融 0.05 1.16 2.95 1.54 \n", "1641 运输 13.75 0.13 3.81 2.14 \n", "1661 电信运营商 1.81 0.50 3.59 4.84 \n", "1681 运输 4.29 0.37 3.96 1.90 \n", "1692 运输 4.64 -0.23 8.84 1.97 \n", "1705 运输 0.30 0.34 2.85 5.94 \n", "1710 运输 3.52 0.44 3.59 2.26 \n", "1736 公用事业 0.76 0.37 3.67 5.37 \n", "1739 综合金融 0.14 0.04 2.52 14.29 \n", "1780 电信运营商 2.19 0.45 3.01 4.45 \n", "1786 银行 0.73 0.14 19.36 2.19 \n", "1824 贸易公司 8.25 0.04 3.46 1.50 \n", "1840 耐用消费品 0.79 0.14 1.81 11.10 \n", "1846 综合金融 0.35 0.17 2.96 10.97 \n", "1852 综合金融 0.43 0.27 5.24 5.00 \n", "1860 食品、饮料和烟草 0.43 0.14 1.00 10.69 \n", "1892 材料 1.43 0.36 2.63 4.52 \n", "1908 运输 1.06 0.33 1.66 4.61 \n", "1920 银行 0.66 0.21 10.92 2.43 \n", "1922 技术硬件和装备 2.46 0.23 2.49 6.40 \n", "1945 运输 3.61 0.02 7.63 1.85 \n", "1948 银行 0.66 0.17 13.45 3.33 \n", "1959 电信运营商 2.90 0.21 6.87 3.98 \n", "1960 技术硬件和装备 5.39 -0.16 5.04 1.27 \n", "1963 技术硬件和装备 6.40 -0.04 3.77 1.39 \n", "1970 食品、饮料和烟草 0.70 0.10 1.19 8.81 \n", "1973 炼油 0.44 0.47 2.07 2.30 \n", "1975 综合金融 0.04 0.47 1.29 0.98 \n", "1986 综合金融 0.90 0.20 3.24 7.05 \n", "1989 材料 0.99 0.17 1.86 8.61 \n", "\n", " Company_en Company_cn Country_cn Country_en \n", "40 PetroChina 中国石油 中国大陆 CN \n", "52 ICBC 中国工商银行 中国大陆 CN \n", "68 CCB-China Construction Bank 中国建设银行 中国大陆 CN \n", "70 Sinopec-China Petroleum 中石化 中国大陆 CN \n", "81 Bank of China 中国银行 中国大陆 CN \n", "88 China Mobile 中国移动 中国香港 HK)/中国大陆(CN \n", "175 Hutchison Whampoa 和记黄埔 中国香港 HK)/中国大陆(CN \n", "180 China Telecom 中国电信 中国大陆 CN \n", "242 China Life Insurance 中国人寿 中国大陆 CN \n", "307 Bank of Communications 中国交通银行 中国大陆 CN \n", "309 Taiwan Semiconductor 台积电 中国台湾 TA \n", "340 Hon Hai Precision Ind 鸿海精密 中国台湾 TA \n", "365 Baoshan Iron & Steel 上海宝钢集团 中国大陆 CN \n", "388 Cathay Financial 国泰金融 中国台湾 TA \n", "394 Cnooc 中海油 中国香港 HK)/中国大陆(CN \n", "400 China Netcom Group 中国网通 中国香港 HK)/中国大陆(CN \n", "422 China Shenhua Energy 中国神华能源股份有限公司 中国大陆 CN \n", "429 BOC Hong Kong 中银香港 中国香港 HK)/中国大陆(CN \n", "436 Formosa Petrochemical 台塑石化 中国台湾 TA \n", "439 Ping An Insurance Group 平安保险 中国大陆 CN \n", "451 Jardine Matheson 香港怡和集团 中国香港 HK)/中国大陆(CN \n", "510 Sun Hung Kai Properties 新鸿基房地产 中国香港 HK)/中国大陆(CN \n", "541 China Unicom 中国联通 中国香港 HK)/中国大陆(CN \n", "551 CLP Holdings 中电控股 中国香港 HK)/中国大陆(CN \n", "575 Chunghwa Telecom 中华电信 中国台湾 TA \n", "600 China Steel 台湾中钢公司 中国台湾 TA \n", "603 China Merchants Bank 招商银行 中国大陆 CN \n", "617 Nan Ya Plastic 南亚塑胶工业 中国台湾 TA \n", "627 Cheung Kong 长江集团 中国香港 HK)/中国大陆(CN \n", "736 Swire Pacific 太古集团 中国香港 HK)/中国大陆(CN \n", "... ... ... ... ... \n", "1636 Champion REIT NaN 中国香港 HK)/中国大陆(CN \n", "1641 Noble Group NaN 中国香港 HK)/中国大陆(CN \n", "1661 Taiwan Mobile NaN 中国台湾 TA \n", "1681 Evergreen Marine NaN 中国台湾 TA \n", "1692 China Southern Airlines NaN 中国大陆 CN \n", "1705 Cosco Pacific NaN 中国香港 HK)/中国大陆(CN \n", "1710 China Shipping Container NaN 中国大陆 CN \n", "1736 China Resources Power Holdings NaN 中国香港 HK)/中国大陆(CN \n", "1739 Citic Securities NaN 中国大陆 CN \n", "1780 Far EasTone Telecom NaN 中国台湾 TA \n", "1786 E.Sun Financial NaN 中国台湾 TA \n", "1824 Minmetals Development NaN 中国大陆 CN \n", "1840 Shanghai Automotive NaN 中国大陆 CN \n", "1846 HK Exchanges & Clearing NaN 中国香港 HK)/中国大陆(CN \n", "1852 Link REIT NaN 中国香港 HK)/中国大陆(CN \n", "1860 Kweichow Moutai NaN 中国大陆 CN \n", "1892 Yanzhou Coal Mining NaN 中国大陆 CN \n", "1908 China Shipping Develop NaN 中国大陆 CN \n", "1920 Wing Lung Bank NaN 中国香港 HK)/中国大陆(CN \n", "1922 Delta Electronics NaN 中国台湾 TA \n", "1945 China Airlines NaN 中国台湾 TA \n", "1948 Wing Hang Bank NaN 中国香港 HK)/中国大陆(CN \n", "1959 PCCW NaN 中国香港 HK)/中国大陆(CN \n", "1960 Benq NaN 中国台湾 TA \n", "1963 TCL Corp NaN 中国大陆 CN \n", "1970 Wuliangye Yibin NaN 中国大陆 CN \n", "1973 CNPC (Hong Kong) NaN 中国香港 HK)/中国大陆(CN \n", "1975 K Wah International NaN 中国香港 HK)/中国大陆(CN \n", "1986 China Overseas Land & Inv NaN 中国香港 HK)/中国大陆(CN \n", "1989 Nine Dragons Paper Holdings NaN 中国香港 HK)/中国大陆(CN \n", "\n", "[131 rows x 13 columns]" ] }, "execution_count": 17, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007[df_2007['Country_cn'].str.contains('中国',regex=True)]" ] }, { "cell_type": "code", "execution_count": 18, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_valueCompany_enCompany_cnCountry_cnCountry_en
40200741PetroChina /中国石油中国大陆(CN)炼油68.4316.5396.42208.76PetroChina中国石油中国大陆CN
52200753ICBC /中国工商银行中国大陆(CN)银行31.984.65800.04176.03ICBC中国工商银行中国大陆CN
68200769CCB-China Construction Bank /中国建设银行中国大陆(CN)银行23.185.84568.21126.55CCB-China Construction Bank中国建设银行中国大陆CN
70200771Sinopec-China Petroleum /中石化中国大陆(CN)炼油99.035.0765.8393.57Sinopec-China Petroleum中石化中国大陆CN
81200782Bank of China /中国银行中国大陆(CN)银行23.103.41585.55143.80Bank of China中国银行中国大陆CN
88200789China Mobile /中国移动中国香港(HK)/中国大陆(CN)电信运营商29.796.5651.35185.31China Mobile中国移动中国香港CN-HK
1752007176Hutchison Whampoa/和记黄埔中国香港(HK)/中国大陆(CN)多元化23.551.8574.9740.57Hutchison Whampoa和记黄埔中国香港CN-HK
1802007181China Telecom/中国电信中国大陆(CN)电信运营商20.983.4650.3437.50China Telecom中国电信中国大陆CN
2422007243China Life Insurance /中国人寿中国大陆(CN)保险11.181.1569.30109.96China Life Insurance中国人寿中国大陆CN
3072007308Bank of Communications/中国交通银行中国大陆(CN)银行6.641.15176.2746.14Bank of Communications中国交通银行中国大陆CN
3092007310Taiwan Semiconductor/台积电中国台湾(TA)半导体9.743.9018.0254.32Taiwan Semiconductor台积电中国台湾CN-TA
3402007341Hon Hai Precision Ind /鸿海精密中国台湾(TA)技术硬件和装备27.781.2413.9934.83Hon Hai Precision Ind鸿海精密中国台湾CN-TA
3652007366Baoshan Iron & Steel /上海宝钢集团中国大陆(CN)材料15.631.5717.5921.42Baoshan Iron & Steel上海宝钢集团中国大陆CN
3882007389Cathay Financial/国泰金融中国台湾(TA)保险10.090.6693.2919.87Cathay Financial国泰金融中国台湾CN-TA
3942007395Cnooc /中海油中国香港(HK)/中国大陆(CN)炼油8.513.1014.2234.94Cnooc中海油中国香港CN-HK
4002007401China Netcom Group /中国网通中国香港(HK)/中国大陆(CN)电信运营商10.691.7024.7015.70China Netcom Group中国网通中国香港CN-HK
4222007423China Shenhua Energy/中国神华能源股份有限公司中国大陆(CN)材料6.471.9417.0845.94China Shenhua Energy中国神华能源股份有限公司中国大陆CN
4292007430BOC Hong Kong/中银香港中国香港(HK)/中国大陆(CN)银行4.131.74106.0325.58BOC Hong Kong中银香港中国香港CN-HK
4362007437Formosa Petrochemical/台塑石化中国台湾(TA)炼油13.561.7412.3519.28Formosa Petrochemical台塑石化中国台湾CN-TA
4392007440Ping An Insurance Group/平安保险中国大陆(CN)保险7.950.5239.6239.60Ping An Insurance Group平安保险中国大陆CN
4512007452Jardine Matheson/香港怡和集团中国香港(HK)/中国大陆(CN)食品市场11.961.2518.3413.59Jardine Matheson香港怡和集团中国香港CN-HK
5102007511Sun Hung Kai Properties /新鸿基房地产中国香港(HK)/中国大陆(CN)综合金融3.302.5629.7229.49Sun Hung Kai Properties新鸿基房地产中国香港CN-HK
5412007542China Unicom /中国联通中国香港(HK)/中国大陆(CN)电信运营商10.670.6017.6316.03China Unicom中国联通中国香港CN-HK
5512007552CLP Holdings /中电控股中国香港(HK)/中国大陆(CN)公用事业5.871.2716.4217.65CLP Holdings中电控股中国香港CN-HK
5752007576Chunghwa Telecom/中华电信中国台湾(TA)电信运营商5.591.4513.9818.22Chunghwa Telecom中华电信中国台湾CN-TA
6002007601China Steel/台湾中钢公司中国台湾(TA)材料8.661.5410.3512.24China Steel台湾中钢公司中国台湾CN-TA
6032007604China Merchants Bank/招商银行中国大陆(CN)银行3.530.4690.7633.19China Merchants Bank招商银行中国大陆CN
6172007617Nan Ya Plastic/南亚塑胶工业中国台湾(TA)化学制品7.641.2211.4713.37Nan Ya Plastic南亚塑胶工业中国台湾CN-TA
6272007628Cheung Kong/长江集团中国香港(HK)/中国大陆(CN)综合金融0.801.8028.0128.39Cheung Kong长江集团中国香港CN-HK
7362007737Swire Pacific /太古集团中国香港(HK)/中国大陆(CN)多元化2.442.4216.0517.32Swire Pacific太古集团中国香港CN-HK
..........................................
163620071637Champion REIT中国香港(HK)/中国大陆(CN)综合金融0.051.162.951.54Champion REITNaN中国香港CN-HK
164120071642Noble Group中国香港(HK)/中国大陆(CN)运输13.750.133.812.14Noble GroupNaN中国香港CN-HK
166120071662Taiwan Mobile中国台湾(TA)电信运营商1.810.503.594.84Taiwan MobileNaN中国台湾CN-TA
168120071682Evergreen Marine中国台湾(TA)运输4.290.373.961.90Evergreen MarineNaN中国台湾CN-TA
169220071693China Southern Airlines中国大陆(CN)运输4.64-0.238.841.97China Southern AirlinesNaN中国大陆CN
170520071706Cosco Pacific中国香港(HK)/中国大陆(CN)运输0.300.342.855.94Cosco PacificNaN中国香港CN-HK
171020071711China Shipping Container中国大陆(CN)运输3.520.443.592.26China Shipping ContainerNaN中国大陆CN
173620071737China Resources Power Holdings中国香港(HK)/中国大陆(CN)公用事业0.760.373.675.37China Resources Power HoldingsNaN中国香港CN-HK
173920071740Citic Securities中国大陆(CN)综合金融0.140.042.5214.29Citic SecuritiesNaN中国大陆CN
178020071781Far EasTone Telecom中国台湾(TA)电信运营商2.190.453.014.45Far EasTone TelecomNaN中国台湾CN-TA
178620071787E.Sun Financial中国台湾(TA)银行0.730.1419.362.19E.Sun FinancialNaN中国台湾CN-TA
182420071825Minmetals Development中国大陆(CN)贸易公司8.250.043.461.50Minmetals DevelopmentNaN中国大陆CN
184020071841Shanghai Automotive中国大陆(CN)耐用消费品0.790.141.8111.10Shanghai AutomotiveNaN中国大陆CN
184620071847HK Exchanges & Clearing中国香港(HK)/中国大陆(CN)综合金融0.350.172.9610.97HK Exchanges & ClearingNaN中国香港CN-HK
185220071853Link REIT中国香港(HK)/中国大陆(CN)综合金融0.430.275.245.00Link REITNaN中国香港CN-HK
186020071861Kweichow Moutai中国大陆(CN)食品、饮料和烟草0.430.141.0010.69Kweichow MoutaiNaN中国大陆CN
189220071892Yanzhou Coal Mining中国大陆(CN)材料1.430.362.634.52Yanzhou Coal MiningNaN中国大陆CN
190820071909China Shipping Develop中国大陆(CN)运输1.060.331.664.61China Shipping DevelopNaN中国大陆CN
192020071920Wing Lung Bank中国香港(HK)/中国大陆(CN)银行0.660.2110.922.43Wing Lung BankNaN中国香港CN-HK
192220071923Delta Electronics中国台湾(TA)技术硬件和装备2.460.232.496.40Delta ElectronicsNaN中国台湾CN-TA
194520071946China Airlines中国台湾(TA)运输3.610.027.631.85China AirlinesNaN中国台湾CN-TA
194820071949Wing Hang Bank中国香港(HK)/中国大陆(CN)银行0.660.1713.453.33Wing Hang BankNaN中国香港CN-HK
195920071959PCCW中国香港(HK)/中国大陆(CN)电信运营商2.900.216.873.98PCCWNaN中国香港CN-HK
196020071961Benq中国台湾(TA)技术硬件和装备5.39-0.165.041.27BenqNaN中国台湾CN-TA
196320071964TCL Corp中国大陆(CN)技术硬件和装备6.40-0.043.771.39TCL CorpNaN中国大陆CN
197020071971Wuliangye Yibin中国大陆(CN)食品、饮料和烟草0.700.101.198.81Wuliangye YibinNaN中国大陆CN
197320071974CNPC (Hong Kong)中国香港(HK)/中国大陆(CN)炼油0.440.472.072.30CNPC (Hong Kong)NaN中国香港CN-HK
197520071976K Wah International中国香港(HK)/中国大陆(CN)综合金融0.040.471.290.98K Wah InternationalNaN中国香港CN-HK
198620071987China Overseas Land & Inv中国香港(HK)/中国大陆(CN)综合金融0.900.203.247.05China Overseas Land & InvNaN中国香港CN-HK
198920071989Nine Dragons Paper Holdings中国香港(HK)/中国大陆(CN)材料0.990.171.868.61Nine Dragons Paper HoldingsNaN中国香港CN-HK
\n", "

131 rows × 13 columns

\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en \\\n", "40 2007 41 PetroChina /中国石油 中国大陆(CN) \n", "52 2007 53 ICBC /中国工商银行 中国大陆(CN) \n", "68 2007 69 CCB-China Construction Bank /中国建设银行 中国大陆(CN) \n", "70 2007 71 Sinopec-China Petroleum /中石化 中国大陆(CN) \n", "81 2007 82 Bank of China /中国银行 中国大陆(CN) \n", "88 2007 89 China Mobile /中国移动 中国香港(HK)/中国大陆(CN) \n", "175 2007 176 Hutchison Whampoa/和记黄埔 中国香港(HK)/中国大陆(CN) \n", "180 2007 181 China Telecom/中国电信 中国大陆(CN) \n", "242 2007 243 China Life Insurance /中国人寿 中国大陆(CN) \n", "307 2007 308 Bank of Communications/中国交通银行 中国大陆(CN) \n", "309 2007 310 Taiwan Semiconductor/台积电 中国台湾(TA) \n", "340 2007 341 Hon Hai Precision Ind /鸿海精密 中国台湾(TA) \n", "365 2007 366 Baoshan Iron & Steel /上海宝钢集团 中国大陆(CN) \n", "388 2007 389 Cathay Financial/国泰金融 中国台湾(TA) \n", "394 2007 395 Cnooc /中海油 中国香港(HK)/中国大陆(CN) \n", "400 2007 401 China Netcom Group /中国网通 中国香港(HK)/中国大陆(CN) \n", "422 2007 423 China Shenhua Energy/中国神华能源股份有限公司 中国大陆(CN) \n", "429 2007 430 BOC Hong Kong/中银香港 中国香港(HK)/中国大陆(CN) \n", "436 2007 437 Formosa Petrochemical/台塑石化 中国台湾(TA) \n", "439 2007 440 Ping An Insurance Group/平安保险 中国大陆(CN) \n", "451 2007 452 Jardine Matheson/香港怡和集团 中国香港(HK)/中国大陆(CN) \n", "510 2007 511 Sun Hung Kai Properties /新鸿基房地产 中国香港(HK)/中国大陆(CN) \n", "541 2007 542 China Unicom /中国联通 中国香港(HK)/中国大陆(CN) \n", "551 2007 552 CLP Holdings /中电控股 中国香港(HK)/中国大陆(CN) \n", "575 2007 576 Chunghwa Telecom/中华电信 中国台湾(TA) \n", "600 2007 601 China Steel/台湾中钢公司 中国台湾(TA) \n", "603 2007 604 China Merchants Bank/招商银行 中国大陆(CN) \n", "617 2007 617 Nan Ya Plastic/南亚塑胶工业 中国台湾(TA) \n", "627 2007 628 Cheung Kong/长江集团 中国香港(HK)/中国大陆(CN) \n", "736 2007 737 Swire Pacific /太古集团 中国香港(HK)/中国大陆(CN) \n", "... ... ... ... ... \n", "1636 2007 1637 Champion REIT 中国香港(HK)/中国大陆(CN) \n", "1641 2007 1642 Noble Group 中国香港(HK)/中国大陆(CN) \n", "1661 2007 1662 Taiwan Mobile 中国台湾(TA) \n", "1681 2007 1682 Evergreen Marine 中国台湾(TA) \n", "1692 2007 1693 China Southern Airlines 中国大陆(CN) \n", "1705 2007 1706 Cosco Pacific 中国香港(HK)/中国大陆(CN) \n", "1710 2007 1711 China Shipping Container 中国大陆(CN) \n", "1736 2007 1737 China Resources Power Holdings 中国香港(HK)/中国大陆(CN) \n", "1739 2007 1740 Citic Securities 中国大陆(CN) \n", "1780 2007 1781 Far EasTone Telecom 中国台湾(TA) \n", "1786 2007 1787 E.Sun Financial 中国台湾(TA) \n", "1824 2007 1825 Minmetals Development 中国大陆(CN) \n", "1840 2007 1841 Shanghai Automotive 中国大陆(CN) \n", "1846 2007 1847 HK Exchanges & Clearing 中国香港(HK)/中国大陆(CN) \n", "1852 2007 1853 Link REIT 中国香港(HK)/中国大陆(CN) \n", "1860 2007 1861 Kweichow Moutai 中国大陆(CN) \n", "1892 2007 1892 Yanzhou Coal Mining 中国大陆(CN) \n", "1908 2007 1909 China Shipping Develop 中国大陆(CN) \n", "1920 2007 1920 Wing Lung Bank 中国香港(HK)/中国大陆(CN) \n", "1922 2007 1923 Delta Electronics 中国台湾(TA) \n", "1945 2007 1946 China Airlines 中国台湾(TA) \n", "1948 2007 1949 Wing Hang Bank 中国香港(HK)/中国大陆(CN) \n", "1959 2007 1959 PCCW 中国香港(HK)/中国大陆(CN) \n", "1960 2007 1961 Benq 中国台湾(TA) \n", "1963 2007 1964 TCL Corp 中国大陆(CN) \n", "1970 2007 1971 Wuliangye Yibin 中国大陆(CN) \n", "1973 2007 1974 CNPC (Hong Kong) 中国香港(HK)/中国大陆(CN) \n", "1975 2007 1976 K Wah International 中国香港(HK)/中国大陆(CN) \n", "1986 2007 1987 China Overseas Land & Inv 中国香港(HK)/中国大陆(CN) \n", "1989 2007 1989 Nine Dragons Paper Holdings 中国香港(HK)/中国大陆(CN) \n", "\n", " Industry_cn Sales Profits Assets Market_value \\\n", "40 炼油 68.43 16.53 96.42 208.76 \n", "52 银行 31.98 4.65 800.04 176.03 \n", "68 银行 23.18 5.84 568.21 126.55 \n", "70 炼油 99.03 5.07 65.83 93.57 \n", "81 银行 23.10 3.41 585.55 143.80 \n", "88 电信运营商 29.79 6.56 51.35 185.31 \n", "175 多元化 23.55 1.85 74.97 40.57 \n", "180 电信运营商 20.98 3.46 50.34 37.50 \n", "242 保险 11.18 1.15 69.30 109.96 \n", "307 银行 6.64 1.15 176.27 46.14 \n", "309 半导体 9.74 3.90 18.02 54.32 \n", "340 技术硬件和装备 27.78 1.24 13.99 34.83 \n", "365 材料 15.63 1.57 17.59 21.42 \n", "388 保险 10.09 0.66 93.29 19.87 \n", "394 炼油 8.51 3.10 14.22 34.94 \n", "400 电信运营商 10.69 1.70 24.70 15.70 \n", "422 材料 6.47 1.94 17.08 45.94 \n", "429 银行 4.13 1.74 106.03 25.58 \n", "436 炼油 13.56 1.74 12.35 19.28 \n", "439 保险 7.95 0.52 39.62 39.60 \n", "451 食品市场 11.96 1.25 18.34 13.59 \n", "510 综合金融 3.30 2.56 29.72 29.49 \n", "541 电信运营商 10.67 0.60 17.63 16.03 \n", "551 公用事业 5.87 1.27 16.42 17.65 \n", "575 电信运营商 5.59 1.45 13.98 18.22 \n", "600 材料 8.66 1.54 10.35 12.24 \n", "603 银行 3.53 0.46 90.76 33.19 \n", "617 化学制品 7.64 1.22 11.47 13.37 \n", "627 综合金融 0.80 1.80 28.01 28.39 \n", "736 多元化 2.44 2.42 16.05 17.32 \n", "... ... ... ... ... ... \n", "1636 综合金融 0.05 1.16 2.95 1.54 \n", "1641 运输 13.75 0.13 3.81 2.14 \n", "1661 电信运营商 1.81 0.50 3.59 4.84 \n", "1681 运输 4.29 0.37 3.96 1.90 \n", "1692 运输 4.64 -0.23 8.84 1.97 \n", "1705 运输 0.30 0.34 2.85 5.94 \n", "1710 运输 3.52 0.44 3.59 2.26 \n", "1736 公用事业 0.76 0.37 3.67 5.37 \n", "1739 综合金融 0.14 0.04 2.52 14.29 \n", "1780 电信运营商 2.19 0.45 3.01 4.45 \n", "1786 银行 0.73 0.14 19.36 2.19 \n", "1824 贸易公司 8.25 0.04 3.46 1.50 \n", "1840 耐用消费品 0.79 0.14 1.81 11.10 \n", "1846 综合金融 0.35 0.17 2.96 10.97 \n", "1852 综合金融 0.43 0.27 5.24 5.00 \n", "1860 食品、饮料和烟草 0.43 0.14 1.00 10.69 \n", "1892 材料 1.43 0.36 2.63 4.52 \n", "1908 运输 1.06 0.33 1.66 4.61 \n", "1920 银行 0.66 0.21 10.92 2.43 \n", "1922 技术硬件和装备 2.46 0.23 2.49 6.40 \n", "1945 运输 3.61 0.02 7.63 1.85 \n", "1948 银行 0.66 0.17 13.45 3.33 \n", "1959 电信运营商 2.90 0.21 6.87 3.98 \n", "1960 技术硬件和装备 5.39 -0.16 5.04 1.27 \n", "1963 技术硬件和装备 6.40 -0.04 3.77 1.39 \n", "1970 食品、饮料和烟草 0.70 0.10 1.19 8.81 \n", "1973 炼油 0.44 0.47 2.07 2.30 \n", "1975 综合金融 0.04 0.47 1.29 0.98 \n", "1986 综合金融 0.90 0.20 3.24 7.05 \n", "1989 材料 0.99 0.17 1.86 8.61 \n", "\n", " Company_en Company_cn Country_cn Country_en \n", "40 PetroChina 中国石油 中国大陆 CN \n", "52 ICBC 中国工商银行 中国大陆 CN \n", "68 CCB-China Construction Bank 中国建设银行 中国大陆 CN \n", "70 Sinopec-China Petroleum 中石化 中国大陆 CN \n", "81 Bank of China 中国银行 中国大陆 CN \n", "88 China Mobile 中国移动 中国香港 CN-HK \n", "175 Hutchison Whampoa 和记黄埔 中国香港 CN-HK \n", "180 China Telecom 中国电信 中国大陆 CN \n", "242 China Life Insurance 中国人寿 中国大陆 CN \n", "307 Bank of Communications 中国交通银行 中国大陆 CN \n", "309 Taiwan Semiconductor 台积电 中国台湾 CN-TA \n", "340 Hon Hai Precision Ind 鸿海精密 中国台湾 CN-TA \n", "365 Baoshan Iron & Steel 上海宝钢集团 中国大陆 CN \n", "388 Cathay Financial 国泰金融 中国台湾 CN-TA \n", "394 Cnooc 中海油 中国香港 CN-HK \n", "400 China Netcom Group 中国网通 中国香港 CN-HK \n", "422 China Shenhua Energy 中国神华能源股份有限公司 中国大陆 CN \n", "429 BOC Hong Kong 中银香港 中国香港 CN-HK \n", "436 Formosa Petrochemical 台塑石化 中国台湾 CN-TA \n", "439 Ping An Insurance Group 平安保险 中国大陆 CN \n", "451 Jardine Matheson 香港怡和集团 中国香港 CN-HK \n", "510 Sun Hung Kai Properties 新鸿基房地产 中国香港 CN-HK \n", "541 China Unicom 中国联通 中国香港 CN-HK \n", "551 CLP Holdings 中电控股 中国香港 CN-HK \n", "575 Chunghwa Telecom 中华电信 中国台湾 CN-TA \n", "600 China Steel 台湾中钢公司 中国台湾 CN-TA \n", "603 China Merchants Bank 招商银行 中国大陆 CN \n", "617 Nan Ya Plastic 南亚塑胶工业 中国台湾 CN-TA \n", "627 Cheung Kong 长江集团 中国香港 CN-HK \n", "736 Swire Pacific 太古集团 中国香港 CN-HK \n", "... ... ... ... ... \n", "1636 Champion REIT NaN 中国香港 CN-HK \n", "1641 Noble Group NaN 中国香港 CN-HK \n", "1661 Taiwan Mobile NaN 中国台湾 CN-TA \n", "1681 Evergreen Marine NaN 中国台湾 CN-TA \n", "1692 China Southern Airlines NaN 中国大陆 CN \n", "1705 Cosco Pacific NaN 中国香港 CN-HK \n", "1710 China Shipping Container NaN 中国大陆 CN \n", "1736 China Resources Power Holdings NaN 中国香港 CN-HK \n", "1739 Citic Securities NaN 中国大陆 CN \n", "1780 Far EasTone Telecom NaN 中国台湾 CN-TA \n", "1786 E.Sun Financial NaN 中国台湾 CN-TA \n", "1824 Minmetals Development NaN 中国大陆 CN \n", "1840 Shanghai Automotive NaN 中国大陆 CN \n", "1846 HK Exchanges & Clearing NaN 中国香港 CN-HK \n", "1852 Link REIT NaN 中国香港 CN-HK \n", "1860 Kweichow Moutai NaN 中国大陆 CN \n", "1892 Yanzhou Coal Mining NaN 中国大陆 CN \n", "1908 China Shipping Develop NaN 中国大陆 CN \n", "1920 Wing Lung Bank NaN 中国香港 CN-HK \n", "1922 Delta Electronics NaN 中国台湾 CN-TA \n", "1945 China Airlines NaN 中国台湾 CN-TA \n", "1948 Wing Hang Bank NaN 中国香港 CN-HK \n", "1959 PCCW NaN 中国香港 CN-HK \n", "1960 Benq NaN 中国台湾 CN-TA \n", "1963 TCL Corp NaN 中国大陆 CN \n", "1970 Wuliangye Yibin NaN 中国大陆 CN \n", "1973 CNPC (Hong Kong) NaN 中国香港 CN-HK \n", "1975 K Wah International NaN 中国香港 CN-HK \n", "1986 China Overseas Land & Inv NaN 中国香港 CN-HK \n", "1989 Nine Dragons Paper Holdings NaN 中国香港 CN-HK \n", "\n", "[131 rows x 13 columns]" ] }, "execution_count": 18, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007['Country_en'] = df_2007['Country_en'].replace(['HK.*','TA'],['CN-HK', 'CN-TA'],regex=True)\n", "df_2007[df_2007['Country_en'].str.contains('CN',regex=True)]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 考虑到其他年份,公司所在行业有用英文名称展示的,这里添加一列英文的行业名称,但内容是空白" ] }, { "cell_type": "code", "execution_count": 19, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_cn_enIndustry_cnSalesProfitsAssetsMarket_valueCompany_enCompany_cnCountry_cnCountry_enIndustry_en
199520071995Fremont General美国(US)综合金融1.250.1712.800.69Fremont GeneralNaN美国US
199620071997United Rentals美国(US)商业服务和供应3.640.225.372.32United RentalsNaN美国US
199720071998CBOT Holdings美国(US)综合金融0.640.170.818.54CBOT HoldingsNaN美国US
199820071998Singapore Petroleum新加坡(SI)炼油5.590.192.051.50Singapore PetroleumNaN新加坡SI
199920072000DVB Bank德国(GE)银行0.770.0612.741.26DVB BankNaN德国GE
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_cn_en Industry_cn Sales \\\n", "1995 2007 1995 Fremont General 美国(US) 综合金融 1.25 \n", "1996 2007 1997 United Rentals 美国(US) 商业服务和供应 3.64 \n", "1997 2007 1998 CBOT Holdings 美国(US) 综合金融 0.64 \n", "1998 2007 1998 Singapore Petroleum 新加坡(SI) 炼油 5.59 \n", "1999 2007 2000 DVB Bank 德国(GE) 银行 0.77 \n", "\n", " Profits Assets Market_value Company_en Company_cn \\\n", "1995 0.17 12.80 0.69 Fremont General NaN \n", "1996 0.22 5.37 2.32 United Rentals NaN \n", "1997 0.17 0.81 8.54 CBOT Holdings NaN \n", "1998 0.19 2.05 1.50 Singapore Petroleum NaN \n", "1999 0.06 12.74 1.26 DVB Bank NaN \n", "\n", " Country_cn Country_en Industry_en \n", "1995 美国 US \n", "1996 美国 US \n", "1997 美国 US \n", "1998 新加坡 SI \n", "1999 德国 GE " ] }, "execution_count": 19, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2007['Industry_en'] = ''\n", "df_2007.tail(5)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **将列名进行重新排序**" ] }, { "cell_type": "code", "execution_count": 20, "metadata": { "collapsed": true }, "outputs": [], "source": [ "columns_sort = ['Year', 'Rank', 'Company_cn_en','Company_en',\n", " 'Company_cn', 'Country_cn_en', 'Country_cn', \n", " 'Country_en', 'Industry_cn', 'Industry_en',\n", " 'Sales', 'Profits', 'Assets', 'Market_value']" ] }, { "cell_type": "code", "execution_count": 21, "metadata": { "collapsed": false, "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "(2000, 14)\n", "Year int64\n", "Rank int64\n", "Company_cn_en object\n", "Company_en object\n", "Company_cn object\n", "Country_cn_en object\n", "Country_cn object\n", "Country_en object\n", "Industry_cn object\n", "Industry_en object\n", "Sales float64\n", "Profits float64\n", "Assets float64\n", "Market_value float64\n", "dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCompany_enCompany_cnCountry_cn_enCountry_cnCountry_enIndustry_cnIndustry_enSalesProfitsAssetsMarket_value
020071Citigroup /花旗集团Citigroup花旗集团美国(US)美国US银行146.5621.541884.32247.42
120072Bank of America /美国银行Bank of America美国银行美国(US)美国US银行116.5721.131459.74226.61
220073HSBC Holdings/汇丰集团HSBC Holdings汇丰集团英国(UK)英国UK银行121.5116.631860.76202.29
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Company_en Company_cn \\\n", "0 2007 1 Citigroup /花旗集团 Citigroup 花旗集团 \n", "1 2007 2 Bank of America /美国银行 Bank of America 美国银行 \n", "2 2007 3 HSBC Holdings/汇丰集团 HSBC Holdings 汇丰集团 \n", "\n", " Country_cn_en Country_cn Country_en Industry_cn Industry_en Sales \\\n", "0 美国(US) 美国 US 银行 146.56 \n", "1 美国(US) 美国 US 银行 116.57 \n", "2 英国(UK) 英国 UK 银行 121.51 \n", "\n", " Profits Assets Market_value \n", "0 21.54 1884.32 247.42 \n", "1 21.13 1459.74 226.61 \n", "2 16.63 1860.76 202.29 " ] }, "execution_count": 21, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# 按指定list重新将columns进行排序\n", "df_2007 = df_2007.reindex(columns=columns_sort)\n", "print(df_2007.shape)\n", "print(df_2007.dtypes)\n", "df_2007.head(3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Year 2008" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 数据加载" ] }, { "cell_type": "code", "execution_count": 22, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "the shape of DataFrame: (2000, 10)\n", "年份 int64\n", "Rank int64\n", "公司名称(英文) object\n", "公司名称(中文) object\n", "Country/area(国家或地区) object\n", "Industry(行业) object\n", "Sales (销售额)($bil十亿美元) object\n", "Profits (利润)($bil) object\n", "Assets 资产($bil) object\n", "Market Value 市值($bil) float64\n", "dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
年份Rank公司名称(英文)公司名称(中文)Country/area(国家或地区)Industry(行业)Sales (销售额)($bil十亿美元)Profits (利润)($bil)Assets 资产($bil)Market Value 市值($bil)
020081HSBC Holdings汇丰集团United KingdomBanking146.519.132,348.98180.81
120082General Electric通用电气公司United StatesConglomerates172.7422.21795.34330.93
220083Bank of America美国银行United StatesBanking119.1914.981,715.75176.53
320084JPMorgan Chase摩根大通公司United StatesBanking116.3515.371,562.15136.88
420085ExxonMobil埃克森美孚公司United StatesOil & Gas Operations358.640.61242.08465.51
\n", "
" ], "text/plain": [ " 年份 Rank 公司名称(英文) 公司名称(中文) Country/area(国家或地区) \\\n", "0 2008 1 HSBC Holdings 汇丰集团 United Kingdom \n", "1 2008 2 General Electric 通用电气公司 United States \n", "2 2008 3 Bank of America 美国银行 United States \n", "3 2008 4 JPMorgan Chase 摩根大通公司 United States \n", "4 2008 5 ExxonMobil 埃克森美孚公司 United States \n", "\n", " Industry(行业) Sales (销售额)($bil十亿美元) Profits (利润)($bil) \\\n", "0 Banking 146.5 19.13 \n", "1 Conglomerates 172.74 22.21 \n", "2 Banking 119.19 14.98 \n", "3 Banking 116.35 15.37 \n", "4 Oil & Gas Operations 358.6 40.61 \n", "\n", " Assets 资产($bil) Market Value 市值($bil) \n", "0 2,348.98 180.81 \n", "1 795.34 330.93 \n", "2 1,715.75 176.53 \n", "3 1,562.15 136.88 \n", "4 242.08 465.51 " ] }, "execution_count": 22, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2008 = pd.read_csv('./data/data_forbes_2008.csv', encoding='gbk', thousands=',')\n", "print('the shape of DataFrame: ', df_2008.shape)\n", "print(df_2008.dtypes)\n", "df_2008.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 更新columns的名称" ] }, { "cell_type": "code", "execution_count": 23, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_enCompany_cnCountry_enIndustry_enSalesProfitsAssetsMarket_value
020081HSBC Holdings汇丰集团United KingdomBanking146.519.132,348.98180.81
120082General Electric通用电气公司United StatesConglomerates172.7422.21795.34330.93
220083Bank of America美国银行United StatesBanking119.1914.981,715.75176.53
320084JPMorgan Chase摩根大通公司United StatesBanking116.3515.371,562.15136.88
420085ExxonMobil埃克森美孚公司United StatesOil & Gas Operations358.640.61242.08465.51
\n", "
" ], "text/plain": [ " Year Rank Company_en Company_cn Country_en \\\n", "0 2008 1 HSBC Holdings 汇丰集团 United Kingdom \n", "1 2008 2 General Electric 通用电气公司 United States \n", "2 2008 3 Bank of America 美国银行 United States \n", "3 2008 4 JPMorgan Chase 摩根大通公司 United States \n", "4 2008 5 ExxonMobil 埃克森美孚公司 United States \n", "\n", " Industry_en Sales Profits Assets Market_value \n", "0 Banking 146.5 19.13 2,348.98 180.81 \n", "1 Conglomerates 172.74 22.21 795.34 330.93 \n", "2 Banking 119.19 14.98 1,715.75 176.53 \n", "3 Banking 116.35 15.37 1,562.15 136.88 \n", "4 Oil & Gas Operations 358.6 40.61 242.08 465.51 " ] }, "execution_count": 23, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2008.columns = ['Year', 'Rank', 'Company_en', 'Company_cn','Country_en', 'Industry_en', 'Sales', 'Profits', 'Assets', 'Market_value']\n", "df_2008.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 添加空白列,使之与其他年份的格式保持一致" ] }, { "cell_type": "code", "execution_count": 24, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_enCompany_cnCountry_enIndustry_enSalesProfitsAssetsMarket_valueCompany_cn_enCountry_cn_enCountry_cnIndustry_cn
020081HSBC Holdings汇丰集团United KingdomBanking146.519.132,348.98180.81
120082General Electric通用电气公司United StatesConglomerates172.7422.21795.34330.93
220083Bank of America美国银行United StatesBanking119.1914.981,715.75176.53
320084JPMorgan Chase摩根大通公司United StatesBanking116.3515.371,562.15136.88
420085ExxonMobil埃克森美孚公司United StatesOil & Gas Operations358.640.61242.08465.51
\n", "
" ], "text/plain": [ " Year Rank Company_en Company_cn Country_en \\\n", "0 2008 1 HSBC Holdings 汇丰集团 United Kingdom \n", "1 2008 2 General Electric 通用电气公司 United States \n", "2 2008 3 Bank of America 美国银行 United States \n", "3 2008 4 JPMorgan Chase 摩根大通公司 United States \n", "4 2008 5 ExxonMobil 埃克森美孚公司 United States \n", "\n", " Industry_en Sales Profits Assets Market_value Company_cn_en \\\n", "0 Banking 146.5 19.13 2,348.98 180.81 \n", "1 Conglomerates 172.74 22.21 795.34 330.93 \n", "2 Banking 119.19 14.98 1,715.75 176.53 \n", "3 Banking 116.35 15.37 1,562.15 136.88 \n", "4 Oil & Gas Operations 358.6 40.61 242.08 465.51 \n", "\n", " Country_cn_en Country_cn Industry_cn \n", "0 \n", "1 \n", "2 \n", "3 \n", "4 " ] }, "execution_count": 24, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2008['Company_cn_en'], df_2008['Country_cn_en'], df_2008['Country_cn'], df_2008['Industry_cn'] = ['','','','']\n", "df_2008.head()" ] }, { "cell_type": "code", "execution_count": 25, "metadata": { "collapsed": true }, "outputs": [], "source": [ "col_digit = ['Sales', 'Profits', 'Assets', 'Market_value']\n", "\n", "for col in col_digit:\n", " # 将数字后面的字母进行替换\n", " df_2008[col] = df_2008[col].replace('([A-Za-z])', '', regex=True)\n", "\n", " # 千分位数字的逗号被识别为string了,需要替换\n", " df_2008[col] = df_2008[col].replace(',', '', regex=True)\n", " \n", " #将数字型字符串转换为可进行计算的数据类型\n", " df_2008[col] = pd.to_numeric(df_2008[col])" ] }, { "cell_type": "code", "execution_count": 26, "metadata": { "collapsed": false }, "outputs": [], "source": [ "# df_2008['Sales'] = pd.to_numeric(df_2008['Sales'])\n", "# df_2008['Profits'] = pd.to_numeric(df_2008['Profits'])\n", "# df_2008['Assets'] = pd.to_numeric(df_2008['Assets'])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 按指定list重新将columns进行排序" ] }, { "cell_type": "code", "execution_count": 27, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "(2000, 14)\n", "Year int64\n", "Rank int64\n", "Company_cn_en object\n", "Company_en object\n", "Company_cn object\n", "Country_cn_en object\n", "Country_cn object\n", "Country_en object\n", "Industry_cn object\n", "Industry_en object\n", "Sales float64\n", "Profits float64\n", "Assets float64\n", "Market_value float64\n", "dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCompany_enCompany_cnCountry_cn_enCountry_cnCountry_enIndustry_cnIndustry_enSalesProfitsAssetsMarket_value
020081HSBC Holdings汇丰集团United KingdomBanking146.5019.132348.98180.81
120082General Electric通用电气公司United StatesConglomerates172.7422.21795.34330.93
220083Bank of America美国银行United StatesBanking119.1914.981715.75176.53
320084JPMorgan Chase摩根大通公司United StatesBanking116.3515.371562.15136.88
420085ExxonMobil埃克森美孚公司United StatesOil & Gas Operations358.6040.61242.08465.51
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Company_en Company_cn Country_cn_en \\\n", "0 2008 1 HSBC Holdings 汇丰集团 \n", "1 2008 2 General Electric 通用电气公司 \n", "2 2008 3 Bank of America 美国银行 \n", "3 2008 4 JPMorgan Chase 摩根大通公司 \n", "4 2008 5 ExxonMobil 埃克森美孚公司 \n", "\n", " Country_cn Country_en Industry_cn Industry_en Sales \\\n", "0 United Kingdom Banking 146.50 \n", "1 United States Conglomerates 172.74 \n", "2 United States Banking 119.19 \n", "3 United States Banking 116.35 \n", "4 United States Oil & Gas Operations 358.60 \n", "\n", " Profits Assets Market_value \n", "0 19.13 2348.98 180.81 \n", "1 22.21 795.34 330.93 \n", "2 14.98 1715.75 176.53 \n", "3 15.37 1562.15 136.88 \n", "4 40.61 242.08 465.51 " ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# 按指定list重新将columns进行排序\n", "df_2008 = df_2008.reindex(columns=columns_sort)\n", "print(df_2008.shape)\n", "print(df_2008.dtypes)\n", "df_2008.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Year 2009" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 数据加载" ] }, { "cell_type": "code", "execution_count": 28, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "the shape of DataFrame: (2000, 9)\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
年份排名(Rank)公司名称(Company)所在国家或地区(Country)所在行业(Industry)销售收入(Sales) ($bil)利润(Profits)总资产(Assets) ($bil)市值(Market Vaue) ($bil)
020091General Electric/通用电气公司United StatesConglomerates182.5217.41797.7789.87
120092Royal Dutch Shell/英荷壳牌集团NetherlandsOil & Gas Operations458.3626.28278.44135.10
220093Toyota Motor/丰田汽车公司JapanConsumer Durables263.4217.21324.98102.35
320094ExxonMobil/埃克森美孚公司United StatesOil & Gas Operations425.745.22228.05335.54
420095BP/英国石油公司United KingdomOil & Gas Operations361.1421.16228.24119.70
\n", "
" ], "text/plain": [ " 年份 排名(Rank) 公司名称(Company) 所在国家或地区(Country) \\\n", "0 2009 1 General Electric/通用电气公司 United States \n", "1 2009 2 Royal Dutch Shell/英荷壳牌集团 Netherlands \n", "2 2009 3 Toyota Motor/丰田汽车公司 Japan \n", "3 2009 4 ExxonMobil/埃克森美孚公司 United States \n", "4 2009 5 BP/英国石油公司 United Kingdom \n", "\n", " 所在行业(Industry) 销售收入(Sales) ($bil) 利润(Profits) 总资产(Assets) ($bil) \\\n", "0 Conglomerates 182.52 17.41 797.77 \n", "1 Oil & Gas Operations 458.36 26.28 278.44 \n", "2 Consumer Durables 263.42 17.21 324.98 \n", "3 Oil & Gas Operations 425.7 45.22 228.05 \n", "4 Oil & Gas Operations 361.14 21.16 228.24 \n", "\n", " 市值(Market Vaue) ($bil) \n", "0 89.87 \n", "1 135.10 \n", "2 102.35 \n", "3 335.54 \n", "4 119.70 " ] }, "execution_count": 28, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2009 = pd.read_csv('./data/data_forbes_2009.csv', encoding='gbk')\n", "print('the shape of DataFrame: ', df_2009.shape)\n", "df_2009.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 更新columns名称" ] }, { "cell_type": "code", "execution_count": 29, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_enIndustry_enSalesProfitsAssetsMarket_value
020091General Electric/通用电气公司United StatesConglomerates182.5217.41797.7789.87
120092Royal Dutch Shell/英荷壳牌集团NetherlandsOil & Gas Operations458.3626.28278.44135.10
220093Toyota Motor/丰田汽车公司JapanConsumer Durables263.4217.21324.98102.35
320094ExxonMobil/埃克森美孚公司United StatesOil & Gas Operations425.745.22228.05335.54
420095BP/英国石油公司United KingdomOil & Gas Operations361.1421.16228.24119.70
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_en Industry_en \\\n", "0 2009 1 General Electric/通用电气公司 United States Conglomerates \n", "1 2009 2 Royal Dutch Shell/英荷壳牌集团 Netherlands Oil & Gas Operations \n", "2 2009 3 Toyota Motor/丰田汽车公司 Japan Consumer Durables \n", "3 2009 4 ExxonMobil/埃克森美孚公司 United States Oil & Gas Operations \n", "4 2009 5 BP/英国石油公司 United Kingdom Oil & Gas Operations \n", "\n", " Sales Profits Assets Market_value \n", "0 182.52 17.41 797.77 89.87 \n", "1 458.36 26.28 278.44 135.10 \n", "2 263.42 17.21 324.98 102.35 \n", "3 425.7 45.22 228.05 335.54 \n", "4 361.14 21.16 228.24 119.70 " ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2009.columns = ['Year', 'Rank', 'Company_cn_en', 'Country_en', 'Industry_en', 'Sales', 'Profits', 'Assets', 'Market_value']\n", "df_2009.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* **拆分\"Company_cn_en\"列**,新生成两列,分别为公司英文名称和中文名称" ] }, { "cell_type": "code", "execution_count": 30, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 General Electric\n", "1 Royal Dutch Shell\n", "2 Toyota Motor\n", "3 ExxonMobil\n", "4 BP\n", "Name: Company_en, dtype: object\n", "1995 NaN\n", "1996 NaN\n", "1997 NaN\n", "1998 NaN\n", "1999 NaN\n", "Name: Company_cn, dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_enIndustry_enSalesProfitsAssetsMarket_valueCompany_enCompany_cn
020091General Electric/通用电气公司United StatesConglomerates182.5217.41797.7789.87General Electric通用电气公司
120092Royal Dutch Shell/英荷壳牌集团NetherlandsOil & Gas Operations458.3626.28278.44135.10Royal Dutch Shell英荷壳牌集团
220093Toyota Motor/丰田汽车公司JapanConsumer Durables263.4217.21324.98102.35Toyota Motor丰田汽车公司
320094ExxonMobil/埃克森美孚公司United StatesOil & Gas Operations425.745.22228.05335.54ExxonMobil埃克森美孚公司
420095BP/英国石油公司United KingdomOil & Gas Operations361.1421.16228.24119.70BP英国石油公司
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_en Industry_en \\\n", "0 2009 1 General Electric/通用电气公司 United States Conglomerates \n", "1 2009 2 Royal Dutch Shell/英荷壳牌集团 Netherlands Oil & Gas Operations \n", "2 2009 3 Toyota Motor/丰田汽车公司 Japan Consumer Durables \n", "3 2009 4 ExxonMobil/埃克森美孚公司 United States Oil & Gas Operations \n", "4 2009 5 BP/英国石油公司 United Kingdom Oil & Gas Operations \n", "\n", " Sales Profits Assets Market_value Company_en Company_cn \n", "0 182.52 17.41 797.77 89.87 General Electric 通用电气公司 \n", "1 458.36 26.28 278.44 135.10 Royal Dutch Shell 英荷壳牌集团 \n", "2 263.42 17.21 324.98 102.35 Toyota Motor 丰田汽车公司 \n", "3 425.7 45.22 228.05 335.54 ExxonMobil 埃克森美孚公司 \n", "4 361.14 21.16 228.24 119.70 BP 英国石油公司 " ] }, "execution_count": 30, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2009['Company_en'],df_2009['Company_cn'] = df_2009['Company_cn_en'].str.split('/', 1).str\n", "print(df_2009['Company_en'][:5])\n", "print(df_2009['Company_cn'] [-5:])\n", "df_2009.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 添加空白列" ] }, { "cell_type": "code", "execution_count": 31, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCountry_enIndustry_enSalesProfitsAssetsMarket_valueCompany_enCompany_cnCountry_cn_enCountry_cnIndustry_cn
020091General Electric/通用电气公司United StatesConglomerates182.5217.41797.7789.87General Electric通用电气公司
120092Royal Dutch Shell/英荷壳牌集团NetherlandsOil & Gas Operations458.3626.28278.44135.10Royal Dutch Shell英荷壳牌集团
220093Toyota Motor/丰田汽车公司JapanConsumer Durables263.4217.21324.98102.35Toyota Motor丰田汽车公司
320094ExxonMobil/埃克森美孚公司United StatesOil & Gas Operations425.745.22228.05335.54ExxonMobil埃克森美孚公司
420095BP/英国石油公司United KingdomOil & Gas Operations361.1421.16228.24119.70BP英国石油公司
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Country_en Industry_en \\\n", "0 2009 1 General Electric/通用电气公司 United States Conglomerates \n", "1 2009 2 Royal Dutch Shell/英荷壳牌集团 Netherlands Oil & Gas Operations \n", "2 2009 3 Toyota Motor/丰田汽车公司 Japan Consumer Durables \n", "3 2009 4 ExxonMobil/埃克森美孚公司 United States Oil & Gas Operations \n", "4 2009 5 BP/英国石油公司 United Kingdom Oil & Gas Operations \n", "\n", " Sales Profits Assets Market_value Company_en Company_cn \\\n", "0 182.52 17.41 797.77 89.87 General Electric 通用电气公司 \n", "1 458.36 26.28 278.44 135.10 Royal Dutch Shell 英荷壳牌集团 \n", "2 263.42 17.21 324.98 102.35 Toyota Motor 丰田汽车公司 \n", "3 425.7 45.22 228.05 335.54 ExxonMobil 埃克森美孚公司 \n", "4 361.14 21.16 228.24 119.70 BP 英国石油公司 \n", "\n", " Country_cn_en Country_cn Industry_cn \n", "0 \n", "1 \n", "2 \n", "3 \n", "4 " ] }, "execution_count": 31, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2009['Country_cn_en'], df_2009['Country_cn'], df_2009['Industry_cn'] = ['','','']\n", "df_2009.head()" ] }, { "cell_type": "code", "execution_count": 32, "metadata": { "collapsed": true }, "outputs": [], "source": [ "col_digit = ['Sales', 'Profits', 'Assets', 'Market_value']\n", "\n", "for col in col_digit:\n", " # 将数字后面的字母进行替换\n", " df_2009[col] = df_2009[col].replace('([A-Za-z])', '', regex=True)\n", "\n", " # 千分位数字的逗号被识别为string了,需要替换\n", " df_2009[col] = df_2009[col].replace(',', '', regex=True)\n", " \n", " df_2009[col] = pd.to_numeric(df_2009[col])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 将columns重新排序" ] }, { "cell_type": "code", "execution_count": 33, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "(2000, 14)\n", "Year int64\n", "Rank int64\n", "Company_cn_en object\n", "Company_en object\n", "Company_cn object\n", "Country_cn_en object\n", "Country_cn object\n", "Country_en object\n", "Industry_cn object\n", "Industry_en object\n", "Sales float64\n", "Profits float64\n", "Assets float64\n", "Market_value float64\n", "dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCompany_enCompany_cnCountry_cn_enCountry_cnCountry_enIndustry_cnIndustry_enSalesProfitsAssetsMarket_value
020091General Electric/通用电气公司General Electric通用电气公司United StatesConglomerates182.5217.41797.7789.87
120092Royal Dutch Shell/英荷壳牌集团Royal Dutch Shell英荷壳牌集团NetherlandsOil & Gas Operations458.3626.28278.44135.10
220093Toyota Motor/丰田汽车公司Toyota Motor丰田汽车公司JapanConsumer Durables263.4217.21324.98102.35
320094ExxonMobil/埃克森美孚公司ExxonMobil埃克森美孚公司United StatesOil & Gas Operations425.7045.22228.05335.54
420095BP/英国石油公司BP英国石油公司United KingdomOil & Gas Operations361.1421.16228.24119.70
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Company_en Company_cn \\\n", "0 2009 1 General Electric/通用电气公司 General Electric 通用电气公司 \n", "1 2009 2 Royal Dutch Shell/英荷壳牌集团 Royal Dutch Shell 英荷壳牌集团 \n", "2 2009 3 Toyota Motor/丰田汽车公司 Toyota Motor 丰田汽车公司 \n", "3 2009 4 ExxonMobil/埃克森美孚公司 ExxonMobil 埃克森美孚公司 \n", "4 2009 5 BP/英国石油公司 BP 英国石油公司 \n", "\n", " Country_cn_en Country_cn Country_en Industry_cn Industry_en \\\n", "0 United States Conglomerates \n", "1 Netherlands Oil & Gas Operations \n", "2 Japan Consumer Durables \n", "3 United States Oil & Gas Operations \n", "4 United Kingdom Oil & Gas Operations \n", "\n", " Sales Profits Assets Market_value \n", "0 182.52 17.41 797.77 89.87 \n", "1 458.36 26.28 278.44 135.10 \n", "2 263.42 17.21 324.98 102.35 \n", "3 425.70 45.22 228.05 335.54 \n", "4 361.14 21.16 228.24 119.70 " ] }, "execution_count": 33, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# 按指定list重新将columns进行排序\n", "df_2009 = df_2009.reindex(columns=columns_sort)\n", "print(df_2009.shape)\n", "print(df_2009.dtypes)\n", "df_2009.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Year 2010" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 数据加载,单位为十亿美元" ] }, { "cell_type": "code", "execution_count": 34, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "the shape of DataFrame: (2001, 10)\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
0123456789
020101摩根大通公司JPMorgan ChaseUnited StatesBanking115.6311.652,031.99166.19
120102通用电气公司General ElectricUnited StatesConglomerates156.7811.03781.82169.65
220103美国银行Bank of AmericaUnited StatesBanking150.456.282,223.30167.63
320104埃克森美孚公司ExxonMobilUnited StatesOil & Gas Operations275.5619.28233.32308.77
420105中国工商银行ICBCChinaBanking71.8616.271,428.46242.23
\n", "
" ], "text/plain": [ " 0 1 2 3 4 5 \\\n", "0 2010 1 摩根大通公司 JPMorgan Chase United States Banking \n", "1 2010 2 通用电气公司 General Electric United States Conglomerates \n", "2 2010 3 美国银行 Bank of America United States Banking \n", "3 2010 4 埃克森美孚公司 ExxonMobil United States Oil & Gas Operations \n", "4 2010 5 中国工商银行 ICBC China Banking \n", "\n", " 6 7 8 9 \n", "0 115.63 11.65 2,031.99 166.19 \n", "1 156.78 11.03 781.82 169.65 \n", "2 150.45 6.28 2,223.30 167.63 \n", "3 275.56 19.28 233.32 308.77 \n", "4 71.86 16.27 1,428.46 242.23 " ] }, "execution_count": 34, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2010 = pd.read_csv('./data/data_forbes_2010.csv', encoding='gbk', header=None)\n", "print('the shape of DataFrame: ', df_2010.shape)\n", "df_2010.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 添加columns的名称" ] }, { "cell_type": "code", "execution_count": 35, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cnCompany_enCountry_enIndustry_enSalesProfitsAssetsMarket_value
020101摩根大通公司JPMorgan ChaseUnited StatesBanking115.6311.652,031.99166.19
120102通用电气公司General ElectricUnited StatesConglomerates156.7811.03781.82169.65
220103美国银行Bank of AmericaUnited StatesBanking150.456.282,223.30167.63
320104埃克森美孚公司ExxonMobilUnited StatesOil & Gas Operations275.5619.28233.32308.77
420105中国工商银行ICBCChinaBanking71.8616.271,428.46242.23
\n", "
" ], "text/plain": [ " Year Rank Company_cn Company_en Country_en \\\n", "0 2010 1 摩根大通公司 JPMorgan Chase United States \n", "1 2010 2 通用电气公司 General Electric United States \n", "2 2010 3 美国银行 Bank of America United States \n", "3 2010 4 埃克森美孚公司 ExxonMobil United States \n", "4 2010 5 中国工商银行 ICBC China \n", "\n", " Industry_en Sales Profits Assets Market_value \n", "0 Banking 115.63 11.65 2,031.99 166.19 \n", "1 Conglomerates 156.78 11.03 781.82 169.65 \n", "2 Banking 150.45 6.28 2,223.30 167.63 \n", "3 Oil & Gas Operations 275.56 19.28 233.32 308.77 \n", "4 Banking 71.86 16.27 1,428.46 242.23 " ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2010.columns = ['Year', 'Rank', 'Company_cn','Company_en', 'Country_en', \n", " 'Industry_en', 'Sales', 'Profits', 'Assets', 'Market_value']\n", "df_2010.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 添加空白列" ] }, { "cell_type": "code", "execution_count": 36, "metadata": { "collapsed": false }, "outputs": [ { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cnCompany_enCountry_enIndustry_enSalesProfitsAssetsMarket_valueCompany_cn_enCountry_cn_enCountry_cnIndustry_cn
020101摩根大通公司JPMorgan ChaseUnited StatesBanking115.6311.652,031.99166.19
120102通用电气公司General ElectricUnited StatesConglomerates156.7811.03781.82169.65
220103美国银行Bank of AmericaUnited StatesBanking150.456.282,223.30167.63
320104埃克森美孚公司ExxonMobilUnited StatesOil & Gas Operations275.5619.28233.32308.77
420105中国工商银行ICBCChinaBanking71.8616.271,428.46242.23
\n", "
" ], "text/plain": [ " Year Rank Company_cn Company_en Country_en \\\n", "0 2010 1 摩根大通公司 JPMorgan Chase United States \n", "1 2010 2 通用电气公司 General Electric United States \n", "2 2010 3 美国银行 Bank of America United States \n", "3 2010 4 埃克森美孚公司 ExxonMobil United States \n", "4 2010 5 中国工商银行 ICBC China \n", "\n", " Industry_en Sales Profits Assets Market_value Company_cn_en \\\n", "0 Banking 115.63 11.65 2,031.99 166.19 \n", "1 Conglomerates 156.78 11.03 781.82 169.65 \n", "2 Banking 150.45 6.28 2,223.30 167.63 \n", "3 Oil & Gas Operations 275.56 19.28 233.32 308.77 \n", "4 Banking 71.86 16.27 1,428.46 242.23 \n", "\n", " Country_cn_en Country_cn Industry_cn \n", "0 \n", "1 \n", "2 \n", "3 \n", "4 " ] }, "execution_count": 36, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df_2010['Company_cn_en'], df_2010['Country_cn_en'], df_2010['Country_cn'], df_2010['Industry_cn'] = ['','','','']\n", "df_2010.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 1600行的标题重复,需要删除" ] }, { "cell_type": "code", "execution_count": 37, "metadata": { "collapsed": false }, "outputs": [], "source": [ "df_2010 = df_2010.drop(1600)\n", "# df_2010.drop(1600, inplace=True)" ] }, { "cell_type": "code", "execution_count": 38, "metadata": { "collapsed": false }, "outputs": [], "source": [ "col_digit = ['Sales', 'Profits', 'Assets', 'Market_value', 'Rank']\n", "\n", "for col in col_digit:\n", " # 将数字后面的字母进行替换\n", " df_2010[col] = df_2010[col].replace('([A-Za-z])', '', regex=True)\n", "\n", " # 千分位数字的逗号被识别为string了,需要替换\n", " df_2010[col] = df_2010[col].replace(',', '', regex=True)\n", " \n", " df_2010[col] = pd.to_numeric(df_2010[col])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "* 将columns重新排序" ] }, { "cell_type": "code", "execution_count": 39, "metadata": { "collapsed": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "(2000, 14)\n", "Year int64\n", "Rank int64\n", "Company_cn_en object\n", "Company_en object\n", "Company_cn object\n", "Country_cn_en object\n", "Country_cn object\n", "Country_en object\n", "Industry_cn object\n", "Industry_en object\n", "Sales float64\n", "Profits float64\n", "Assets float64\n", "Market_value float64\n", "dtype: object\n" ] }, { "data": { "text/html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
YearRankCompany_cn_enCompany_enCompany_cnCountry_cn_enCountry_cnCountry_enIndustry_cnIndustry_enSalesProfitsAssetsMarket_value
020101JPMorgan Chase摩根大通公司United StatesBanking115.6311.652031.99166.19
120102General Electric通用电气公司United StatesConglomerates156.7811.03781.82169.65
220103Bank of America美国银行United StatesBanking150.456.282223.30167.63
320104ExxonMobil埃克森美孚公司United StatesOil & Gas Operations275.5619.28233.32308.77
420105ICBC中国工商银行ChinaBanking71.8616.271428.46242.23
\n", "
" ], "text/plain": [ " Year Rank Company_cn_en Company_en Company_cn Country_cn_en \\\n", "0 2010 1 JPMorgan Chase 摩根大通公司 \n", "1 2010 2 General Electric 通用电气公司 \n", "2 2010 3 Bank of America 美国银行 \n", "3 2010 4 ExxonMobil 埃克森美孚公司 \n", "4 2010 5 ICBC 中国工商银行 \n", "\n", " Country_cn Country_en Industry_cn Industry_en Sales \\\n", "0 United States Banking 115.63 \n", "1 United States Conglomerates 156.78 \n", "2 United States Banking 150.45 \n", "3 United States Oil & Gas Operations 275.56 \n", "4 China Banking 71.86 \n", "\n", " Profits Assets Market_value \n", "0 11.65 2031.99 166.19 \n", "1 11.03 781.82 169.65 \n", "2 6.28 2223.30 167.63 \n", "3 19.28 233.32 308.77 \n", "4 16.27 1428.46 242.23 " ] }, "execution_count": 39, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# 按指定list重新将columns进行排序\n", "df_2010 = df_2010.reindex(columns=columns_sort)\n", "print(df_2010.shape)\n", "print(df_2010.dtypes)\n", "df_2010.head()" ] }, { "cell_type": "code", "execution_count": 40, "metadata": { "collapsed": true }, "outputs": [], "source": [ "# df_2010.to_csv('data_forbes_2010_update.csv')" ] } ], "metadata": { "anaconda-cloud": {}, "kernelspec": { "display_name": "Python [conda root]", "language": "python", "name": "conda-root-py" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.5.2" }, "toc": { "colors": { "hover_highlight": "#DAA520", "navigate_num": "#000000", "navigate_text": "#333333", "running_highlight": "#FF0000", "selected_highlight": "#FFD700", "sidebar_border": "#EEEEEE", "wrapper_background": "#FFFFFF" }, "moveMenuLeft": true, "nav_menu": { "height": "12px", "width": "252px" }, "navigate_menu": true, "number_sections": true, "sideBar": true, "threshold": 4, "toc_cell": true, "toc_position": { "height": "668px", "left": "0px", "right": "1154px", "top": "106px", "width": "212px" }, "toc_section_display": "block", "toc_window_display": true, "widenNotebook": false } }, "nbformat": 4, "nbformat_minor": 1 }