qypx の blog

id	name
1	Google
2	淘宝
3	微博
4	Facebook

id	address
1	美国
5	中国
3	中国
6	美国

id	name	address
1	Google	美国
3	微博	中国

Python直接赋值、浅拷贝和深拷贝以及切片

发表于 2020-11-15 更新于 2024-08-09 分类于 Python

参考
https://www.runoob.com/w3cnote/python-understanding-dict-copy-shallow-or-deep.html

1. 直接赋值

直接赋值： b = a , a 和 b 都指向同一个对象，则若改变a或b，另一个变量的值会跟着改变。

直接赋值：其实就是对象的引用（别名）。

阅读全文 »

conda常用命令

发表于 2020-11-15 更新于 2024-08-09 分类于 Jupyter Notebook

参考 https://blog.csdn.net/Destiny_zz/article/details/88634513

conda -V 检查是否安装以及当前conda的版本 conda list 查看安装了哪些包 conda update conda 检查更新当前conda

下载新版本的Anaconda: https://repo.anaconda.com/archive/

虚拟环境

1. 创建python虚拟环境

conda create -n your_env_name python=X.X (2.7、3.6等) 创建python版本为X.X、名字为your_env_name的虚拟环境。your_env_name文件可在Anaconda安装目录envs文件夹下找到。

如果报错：Conda创建环境失败：CondaHTTPError: HTTP 000 CONNECTION FAILED

（参考：https://blog.csdn.net/sinat_38079265/article/details/121163019）

错误原因：默认镜像源访问速度过慢，会导致超时从而导致更新和下载失败。

解决方法为：更换conda镜像源为国内镜像源。

以清华镜像源为例，依次执行以下四步命令

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes

后续步骤见上面链接

2. 激活或切换不同的虚拟环境

python --version 检查当前 python 版本

切换虚拟环境： Linux: source activate your_env_name(虚拟环境名称) Windows: activate your_env_name(虚拟环境名称)

阅读全文 »

Python中的reverse, reversed, sort, sorted

发表于 2020-10-30 更新于 2024-08-09 分类于 Python

参考:
https://note.nkmk.me/en/python-reverse-reversed/
https://note.nkmk.me/en/python-list-sort-sorted/

1. Reverse

对于list, 可以使用 .reverse(), reversed(), 和切片[::-1] 对于字符串和元组（都不可变），可以使用reversed()和切片[::-1]

↑ .reverse() 是列表的方法，是in-place的，会改变原列表，所以String和Tuple不能使用（切片操作实际是一种copy，会生成一个新的列表而不会改变原列表）

1.1 list

List type method reverse() reverses the original list.

reverse()是列表的一个内置方法，改变原列表，reverse()返回None

org_list = [1, 2, 3, 4, 5]

org_list.reverse()
print(org_list)
# [5, 4, 3, 2, 1]

print(org_list.reverse())
# None

Built-in function reversed() returns a reverse iterator

reversed()是python的一个内置方法，不会改变原列表，返回一个迭代器，可用list()获取作用后的值

org_list = [1, 2, 3, 4, 5]

reverse_iterator = reversed(org_list)
print(org_list)
# [1, 2, 3, 4, 5]

print(reverse_iterator)
#<list_reverseiterator object at 0x7fdd7151a940>

print(type(reverse_iterator))
# <class 'list_reverseiterator'>

new_list = list(reversed(org_list))
print(org_list)
print(new_list)
# [1, 2, 3, 4, 5]
# [5, 4, 3, 2, 1]

切片：\([start:end:step]\)

忽略start和end时，选取整个list，step=-1，从后往前依次遍历

org_list = [1, 2, 3, 4, 5]

new_list = org_list[::-1]
print(org_list)
print(new_list)
# [1, 2, 3, 4, 5]
# [5, 4, 3, 2, 1]

阅读全文 »

数据仓库简介

发表于 2020-10-27 更新于 2024-08-22 分类于 Hadoop

阅读全文 »

熵、条件熵、互信息、相对熵

发表于 2020-10-19 更新于 2024-08-08 分类于统计学知识

阅读全文 »

Precision, Recall, ROC曲线等

发表于 2020-08-07 更新于 2024-08-09 分类于机器学习

阅读全文 »

1. 总体架构

本节介绍的几种推荐系统架构，并不是互相独立的关系，实际的推荐系统可能会用到其中一种或者几种的架构。在实际设计的过程中，读者可以把本文介绍的架构作为一个设计的起点，更多地结合自身业务特点进行独立思考，从而设计出适合自身业务的系统。

根据响应用户行为的速度不同，推荐系统可以大致分为基于离线训练和在线训练的推荐系统。

1.1 离线推荐

基于离线训练的推荐系统架构是最常见的一种推荐系统架构。这里的“离线”训练指的是使用历史一段时间（比如周或者几周）的数据进行训练，模型迭代的周期较长（一般以小时为单位）。模型拟合的是用户的中长期兴趣。

如下图所示，一个典型的基于离线训练的推荐系统架构由数据上报、离线训练、在线存储、实时计算和 A/B 测试这几个模块组成。其中，数据上报和离线训练组成了监督学习中的学习系统，而实时计算和 A/B 测试组成了预测系统。另外，除了模型之外，还有一个在线存储模块，用于存储模型和模型需要的特征信息供实时计算模块调用。图中的各个模块组成了训练和预测两条数据流，训练的数据流搜集业务的数据最后生成模型存储于在线存储模块；预测的数据流接受业务的预测请求，通过 A/B 测试模块访问实时计算模块获取预测结果。

阅读全文 »

qypx の blog

Linux常用命令

0. 在线使用 Linux Shell

1. 常用命令

1.1 ls 命令 - 显示指定工作目录下的内容

1.2 查看文件内容：cat

SQL中的各种连接join

1. INNER JOIN

Python直接赋值、浅拷贝和深拷贝以及切片

1. 直接赋值

conda常用命令

虚拟环境

1. 创建python虚拟环境

2. 激活或切换不同的虚拟环境

Python中的reverse, reversed, sort, sorted

1. Reverse

1.1 list

数据仓库简介

熵、条件熵、互信息、相对熵

Precision, Recall, ROC曲线等

推荐系统冷启动问题

8.1 用户冷启动

8.2 物品冷启动

推荐系统总体架构及特征数据

1. 总体架构

1.1 离线推荐