数据人论坛 » 陆勤
陆勤

用户名:陆勤

注册于:2016-04-17

主题数: 65     回贴数: 10

网站: www.shujuren.org/u/luqin

最后活动于3 天前
创建了主题  › 什么是深度学习?

什么是深度学习?



深度学习是机器学习的分支,机器学习是人工智能的分支。

«  3 天前
创建了主题  › pandas获取数据子集?

«  8 天前
创建了主题  › pandas实现数据可视化?

我们常用P

«  16 天前
创建了主题  › 随机梯度下降分类器算法?

随机梯度下降(SGD)是一种简单但非常有效的方法,用于凸损失函数诸如(线性)支持向量机和Logistic回归的线性分类器的判别学习。尽管SGD早在机器学习社区中出现,但最近在大规模学习的背景下它已经受到了相当多的关注。


SGD已成功应用于文本分类和自然语言处理中经常遇到的大规模稀疏机器学习问题。由于数据稀疏,SGD分类器可轻松扩展到超过10 ^ 5个训练样例和超过10 ^ 5个特征的问题。


«  16 天前
回复了主题  › [整洁星期二]开篇

整洁星期二(TidyTeusday)

«  17 天前
创建了主题  › R语言实现决策树模型?

R语言利用rpart包做决策树模型,利用rpart.plot包对决策树模型结果做可视化分析。

详细数据集和代码,请下载附件使用。


附件:


«  18 天前
创建了主题  › pandas类SQL连接操作?
«  18 天前
创建了主题  › pandas做透视表分析?

pandas做透视表分析,提供一份数据集和相应的notebook。请下载附件查阅:


附件:

«  20 天前
创建了主题  › 图文说数:数学基础,机器学习模型开发流程

数学基础

包括算术运算,比较运算,三角运算,概率和统计,线性代数,微积分,复数等数学基础。数学是诸多学科的根基。感受数学的美,利用数学的本。


机器学习模型开发流程

«  24 天前
创建了主题  › 图文说数:数据科学工作流、线性回归模型和逻辑回归模型

数据科学工作流


与我一直倡导的的业务层-数据层-特征层-算法层-应用层,具有异曲同工。


线性回归模型

«  24 天前
创建了主题  › 逻辑回归算法?

逻辑回归用于基于一个或多个预测变量(x)预测个体的类。 它用于建模二元结果,即变量,它只能有两个可能的值:0或1,是或否,患病或无患病。


Logistic回归属于一个名为广义线性模型(GLM)的族,用于将线性回归模型扩展到其他情境。 其他同义词是二元逻辑回归,二项Logistic回归和logit模型。


逻辑回归不直接返回观察类。 它允许我们估计类成员的概率(p)。 概率介于0和1之间。您需要确定类别从一种情况转移到另

«  26 天前
创建了主题  › 逐步回归算法?

«  26 天前
创建了主题  › tensorflow2.0工作环境搭建?

tensorflow2.0工作环境搭建,步骤如下:


第一步:打开Anaconda Prompt,创建mytensorflow工作环境

conda create --name mytensorflow python=3.7


第二步:查看当前工作的环境(以*标记)

conda info --env
«  30 天前
创建了主题  › SVM算法理解?

一 问题定义


«  2019-05-16
创建了主题  › 逻辑回归算法的损失函数?

逻辑回归算法

«  2019-05-16
创建了主题  › 数据标准化?

数据标准化是常用的数据转换方法。


一  数据标准化

把变量集的均值化为0,方差化为1

import pandas as pd from sklearn.datasets import load_iris from sklearn import preprocessing # 加载数据集 iris = load_iris() X = iris.data print('{:*^60}'.format('变量集标准化前')) X_df = p
«  2019-05-09
创建了主题  › 快速而有效做数据分析?

数据分析是询问数据问题和解答数据问题。


利用Python的pandas快速而有效地做数据分析


一 数据总况


1 加载数据集

import pandas as pd names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] # 数据加载 dat
«  2019-05-09
创建了主题  › xgboost模型实现代码片段

利用xgboost库和scikit-learn库完成xgboost模型构建和评估。

# 导入所需库 from numpy import loadtxt from xgboost import XGBClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix imp
«  2019-05-09
创建了主题  › 机器学习算法代码片段

利用Python的scikit-learn库实现常用的机器学习算法。


一  逻辑回归算法


# 导入所需库 from sklearn import datasets from sklearn import metrics from sklearn.linear_model import LogisticRegression import warnings warning
«  2019-05-09
创建了主题  › 描述性统计理解数据?

利用描述性统计帮助你理解数据。利用Python语言做描述性统计分析。


一 数据查看

import pandas as pd url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', '
«  2019-05-09
创建了主题  › 风控建模工程师(广州,薪资面谈)

职责描述:

1、应用机器学习方法,建模优化业务场景中各类问题,包括但不限于建立申请评分模型,行为评分模型,催收评分模型,损失评分;        

2、运用风险决策分析手段对客户的行为进行数据挖掘,研究客群特征,不断优化模型;                  

3、上线模型维护,定期监控模型表现及稳定性,并对相关问题进行优化解决; 

4、主导并能独立完成不同的模型

 

任职要求:

1、本科及以上学历,统计、数学、计算机相关学科优先;

«  2019-05-08
创建了主题  › 神经网络中为什么需要偏置bias?


神经网络中需要bias参数。


解释如下:


«  2019-05-06
创建了主题  › R语言做帕累托图?

帕累托图

«  2019-04-25
创建了主题  › Rmarkdown插入代码快捷键?

R Markdown嵌入代码极其方便,快捷键:

Ctrl + Alt + I


«  2019-04-23
创建了主题  › Python做图中文显示乱码问题解决方法?

利用Jupyter notebook演示

问题重现:

import pandas as pd import matplotlib.pyplot as plt import warnings %matplotlib inline# 数据导入 snd = pd.read_csv('raw_data/sndHsPr.csv')
«  2019-04-22
创建了主题  › MySQL字符串判断是否包含子串?

方法一: 模糊查询,关键词like

SELECT * FROM users WHERE emails like "%b@email.com%";


方法二:locate函数,若是包含,返回大于0的数,否则返回0


例如:

«  2019-04-22
回复了主题  › Tableau 10.5的破解版本获取

回复#1 @yiyi663311 :

使用过程中,有什么心得和收货,跟大家分享


«  2019-04-18
创建了主题  › Tableau 10.5的破解版本获取

Tableau10.5的破解版本获取地址,请点击附件。


«  2019-04-17
创建了主题  › Spyder常用快捷键

Spyder常用快捷键


«  2019-04-15
创建了主题  › pandas库cut()和qcut()函数的差异?

cut()函数:等宽分箱

qcut()函数:等频分箱


代码:

# -*- coding: utf-8 -*- import numpy as np import pandas as pd import warnings warnings.filterwarnings('ignore') np.random.seed(1234) factors = np.random.randn(30)
«  2019-04-11
信息栏
数据人网是数据人学习、交流和分享的平台,专注于从数据中学习,努力发觉数据之洞见,积极利用数据之价值