社区首页 >专栏 >【强强联合】在Power BI 中使用Python（3）数据可视化

【强强联合】在Power BI 中使用Python（3）数据可视化

陈学谦

发布于 2020-04-14 07:28:24

3K01

代码可运行

文章被收录于专栏：学谦数据运营学谦数据运营

运行总次数：1

代码可运行

前两篇文章我们讲解了在Power BI中使用Python来获取数据的一些应用：

【强强联合】在Power BI 中使用Python（1）

以及如何在Power BI中使用Python进行数据清洗工作：

【强强联合】在Power BI 中使用Python（2）

这一篇我们继续讲解如何在Power BI中使用Python进行可视化呈现工作。

打开Power BI Desktop，在右侧可视化区域会看到一个“Py”的图标，打开该图标,并选择启用脚本视觉对象，拖动字段到“值”的位置：

添加了字段之后，在Python脚本编辑器中，自动显示了几行内容：

# dataset = pandas.DataFrame(dead, country, confirm)
# dataset = dataset.drop_duplicates()

注意：这两行代码显示的是被“#”注释掉了，但是在后台有完全相同的两行代码被真实执行了。另外，第二行代码的意思是去重，需要注意。

为了确保图像能够正确显示，可以在python开发界面将代码调试无误后COPY过来，当然，如果你是大神，也可以在里面直接RUN。

反正我是不敢。溜了溜了~

例子

废话不多说，我们直接举两个栗子：

First ~~blood~~ one：

在编辑区域输入代码：

import matplotlib.pyplot as plt
plt.plot(dataset["confirm"],dataset["dead"])
plt.show()

点击运行，发现并没有完整显示数据，且不够美观也不够直观。

这里需要做一些处理，因为“confirm”和“dead”字段默认是以求和的方式显示的，所以只有一个点的数据。

在可视化的值这里对“confirm”和“dead”字段分别选择“不汇总”。再运行代码，这样出来的就是正常的图形了：

我们也可以对中间这行代码进行适当修饰：

plt.plot(dataset["confirm"],dataset["dead"],color="red",marker="o")

以获得我们想要的形状和信息：

当然，还是比较丑陋……原谅我的审美。

我们再举个美观一点的例子：柱状图。仍然是插入可视化对象-添加字段-输入Python代码：

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
cams=dataset['cams'].values.tolist()
IncomePercents=dataset['IncomePercents'].values.tolist()
plt.figure(figsize=(60,20))
plt.yticks(fontsize=15)
plt.bar(np.arange(len(cams)),IncomePercents,label='课收完成率',width=0.8)
plt.show()

结果得到一个很丑陋的柱状图……还不如直接用Power BI做呢！

没关系，我们只要按照下面的步骤适当调整一下代码：

就得到了我们想要的结果：

还是乖乖地双手奉上源代码：

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

cams=dataset['cams'].values.tolist()
IncomePercents=dataset['IncomePercents'].values.tolist()
plt.figure(figsize=(60,10))
plt.xticks(np.arange(len(cams)), cams)

colors=[]
cam_num=0
for cam in cams:
    cam_num+=1
    if cam!='整体':
        colors.append('r')
    else:
        break
colors.append('g')
cam_num+=1
while cam_num<=len(cams):
    colors.append('c')
    cam_num+=1

a=plt.bar(np.arange(len(cams)),IncomePercents,label='完成率',color=colors,width=0.8)

def autolabel(rects):
    for rect in rects:
        height = rect.get_height()
        plt.text(rect.get_x()+rect.get_width()/2.-0.3, 1.01*height, '{:.1%}'.format(float(height)),fontsize=15)

autolabel(a)
plt.xticks(rotation=30,fontsize=12)
plt.yticks(fontsize=15)
plt.ylabel('完成率',fontsize=18)

curr_time = datetime.datetime.now()
time_str = datetime.datetime.strftime(curr_time,'%Y-%m-%d %H:%M:%S')
plt.title('2020年03月各公司完成率\n'+time_str+'数据',fontsize=30)
def to_percent(temp, position):
    return '%1.0f'%(100*temp) + '%'
plt.gca().yaxis.set_major_formatter(FuncFormatter(to_percent))
plt.legend()
plt.show()