-
36早报|扎克伯格创造了钢铁侠里的贾维斯 警方用大数据分析抓获18
所属栏目:[大数据] 日期:2021-01-02 热度:66
副标题#e# Hi,早上好,亲爱的小伙伴们,昨天是冬至节,你有吃饺子吗? 都说冬至节不吃饺子耳朵会被冻掉哦~先上一张我小时候吃饺子的照片,有没有满满的既视感→→? 过完了冬至节,马上就要迎来平安夜,圣诞节,元旦节,春节…… 好吧,这似乎和大数据没啥[详细]
-
大数据处理分析工具
所属栏目:[大数据] 日期:2021-01-02 热度:57
hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop[详细]
-
bfprt算法,中位数的中位数算法,O(n)时间复杂度求解第k大数
所属栏目:[大数据] 日期:2021-01-02 热度:94
215. Kth Largest Element in an Array 题目地址 https://leetcode.com/problems/kth-largest-element-in-an-array/ 题目描述 Find the kth largest element in an unsorted array. Note that it is the kth largest element in the sorted order,not the[详细]
-
棋盘覆盖。大数
所属栏目:[大数据] 日期:2021-01-02 热度:187
棋盘覆盖 时间限制:3000?ms ?|? 内存限制:65535?KB 难度:3 描述 在一个2 k ×2 k (1=k=100)的棋盘中恰有一方格被覆盖,如图1(k=2时),现用一缺角的2×2方格(图2为其中缺右下角的一个),去覆盖2 k ×2 k 未被覆盖过的方格,求需要类似图2方格总的[详细]
-
BI入门经典
所属栏目:[大数据] 日期:2021-01-02 热度:67
副标题#e# 【前言】 ?????昨天论坛的SQL Server大版新增了一个BI板块,大家讨论得热火朝天,由于此前因为客户环境的问题,一直在使用sql 2000,没怎么关注这一块的东西,最近刚好要做购物篮的分析,所以到网上搜集了一些资料。为了跟大家保持“步调一致”,[详细]
-
为什么说OLAP产品毁了BI?
所属栏目:[大数据] 日期:2021-01-02 热度:100
? ? ? ?企业为了确定经营战略和市场战略所进行的经营活动,在BI项目的分析决策过程中,需要基于多种报告和报表进行分析。理想的市场活动展开,大多需要各个营业点的销售报表,每种商品按季节销售的业绩图表等,这就需要大量准确的并且易于判断的数据。 然[详细]
-
大道至简的数据处理工具-(Microsoft Power Query入门)
所属栏目:[大数据] 日期:2021-01-02 热度:167
副标题#e# 大道至简的数据处理工具-Microsoft Power Query 告别复杂的excel函数,excel VBA编程,让一切回归简单与职能。 什么样的人群适合这样的一个工具: 1、出纳、会计、统计、仓管、数据分析等与数据打交道的的岗位。 2、不想学处理数据的函数、VBA编[详细]
-
数据处理方式与控制程序方式不同
所属栏目:[大数据] 日期:2021-01-02 热度:148
结构化方法是直接通过程序来处理数据,处理完毕后即可显示处?理结果,在控制程序方式上是按照设计调用或返回程序不能自由导航,?各模块程序之间存在着控制与被控制的关系;面向对象方法将数据与?对应的代码封装成一个整体,原则上其它对象不能直接修改其数[详细]
-
算法提高 大数加法
所属栏目:[大数据] 日期:2021-01-01 热度:143
问题描述 输入两个正整数a,b,输出a+b的值。 输入格式 两行,第一行a,第二行b。a和b的长度均小于1000位。 输出格式 一行,a+b的值。 样例输入 4 2 样例输出 6 #includestdio.h#includestring.hvoid fun(int n,int sum[]){int temp,i;for(i=0;in;i++){temp[详细]
-
[bigdata-031] python3+selenium 做抓取
所属栏目:[大数据] 日期:2021-01-01 热度:94
1. 安装 1.1 pip3 install -U selenium 1.2 下载 https://github.com/mozilla/geckodriver/releases/download/v0.13.0/geckodriver-v0.13.0-linux64.tar.gz? 解压缩,然后放到/usr/bin目录 2. 抓取豆瓣 #!/usr/bin/env python3#!-*- coding:utf-8 -*-impor[详细]
-
logminer挖掘
所属栏目:[大数据] 日期:2021-01-01 热度:161
1.???? Logminer介绍 LogMiner 是Oracle公司从产品8i以后提供的一个实际非常有用的分析工具,使用该工具可以轻松获得Oracle 重做日志文件(归档日志文件)中的具体内容,LogMiner分析工具实际上是由一组PL/SQL包和一些动态视图组成,它作为Oracle数据库的[详细]
-
[bigdata-005] 用docker搭建oracle 11g并提供python3 开发
所属栏目:[大数据] 日期:2021-01-01 热度:183
参考资料 http://www.bubuko.com/infodetail-401514.html 1. docker上的oracle 11g https://hub.docker.com/r/alexeiled/docker-oracle-xe-11g/ 安装和启动命令: 1.1 docker pull alexeiled/docker-oracle-xe-11g 1.2 docker run --name dck-oracle-11g -[详细]
-
[bigdata-006] 工作流 tez和oozie
所属栏目:[大数据] 日期:2021-01-01 热度:130
1.? 基本状况 Tez是Hortonworks开发的。 董西成的分析 http://dongxicheng.org/mapreduce-nextgen/apache-tez/ http://zh.hortonworks.com/blog/introducing-tez-faster-hadoop-processing/ tez运行在Yarn上的,DAG工作流,底层设计,对Map和Reduce进一步[详细]
-
HDoj1047Integer Inquiry(大数连续相加)
所属栏目:[大数据] 日期:2021-01-01 热度:155
Integer Inquiry Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 19438????Accepted Submission(s): 5087 Problem Description One of the first users of BIT's new supercomputer was Chip[详细]
-
读取csv数据并保存成图像
所属栏目:[大数据] 日期:2021-01-01 热度:107
int main(int argc,char* argv[]){ifstream file("******.csv");string value;int i = 0;int j = 0;while (file.good()){getline(file,value,'n');//cout string(value,value.length()) endl;if (i 0){value.erase(0,2);value.erase(value.length() - 9);[详细]
-
几种大数阶乘算法效率比较(Java)
所属栏目:[大数据] 日期:2021-01-01 热度:98
完整代码: package bigdatamul;import java.math.BigInteger;/** * 大数阶乘 * * @Description: TODO(大数阶乘) * * @author yzy * @date 2016-12-20 上午9:31:14 * */public class Test { public static void main(String[] args) { //单位:ms //fun1(5[详细]
-
报告一:知识工程与大数据分析
所属栏目:[大数据] 日期:2021-01-01 热度:120
报告一:知识工程与大数据分析 报告人:漆桂林博士,东南大学教授 主要内容:知识工程是人工智能的重要分支之一,知识的获取和基于知识的推理能力是人类高级智能的体现。知识工程涉及到机器学习、知识表示与推理、自然语言处理和数据存储等技术。本报告将[详细]
-
从小程序的理念,挖掘小程序的方方面面
所属栏目:[大数据] 日期:2020-12-31 热度:156
副标题#e# 小程序发布已过去3天,这个微信放的大招让整个互联网圈高潮了一把。目前业界已有各种小程序的分析和预测,也有很多诸如小程序解放了内存、小程序没用的声音。本文挖掘小程序背后表现出的理念,借这些理念阐述我对小程序的看法,适合的应用、与APP[详细]
-
[bigdata-030] cdh 5.9的impyla操作hiveserver2
所属栏目:[大数据] 日期:2020-12-31 热度:167
参考文献:http://www.aichengxu.com/view/11094184 1. cdh 5.9 2. 开发机已经安装了impyla pip install thrift_sasl pip install sasl 3. 在cdh集群的一个节点启动hiveserver2 3.1 修改/etc/hive/conf.cloudera.hive/hive-site.xml 增加属性 property ? n[详细]
-
HDU 2054 判断大数是否相等
所属栏目:[大数据] 日期:2020-12-31 热度:170
原题链接:http://acm.hdu.edu.cn/showproblem.php?pid=2054 题解:这个题不严谨,仅判断后向0就行,而且不用判正负。 代码: #includeiostreamusing namespace std;const int maxn = 100000;void cleanlastzero(char str[]) { int len = strlen(str),digi[详细]
-
51 Nod 1028 大数乘法 V2 NTT 学习
所属栏目:[大数据] 日期:2020-12-31 热度:127
题意:求两个大数的乘积 解题方法:之前已经用FFT做过了,今天学习一下NTT,记录一下模板。 先所以下NTT,具体的讲解可以看见这里 为了避免FFT在复数和浮点运算中出现精度问题,所以在某些情况下使用NTT。记录一下NTT的模板,其实和FFT很多一样。对了这个[详细]
-
一份价值百万的大数据分析报告如何炼成?
所属栏目:[大数据] 日期:2020-12-31 热度:124
作者 | 江颖 大数据文摘欢迎各类优质稿件 请联系tougao@bigdatadigest.cn 序 曾经,咨询公司一份报告就能收取企业几十万、甚至于上百万。而今,矫枉过正,数据分析报告却常常被企业认为没有任何实际价值。我经常和企业交流,他们告诉我,需要的是能够为他[详细]
-
什么是AI,叫人工智能,和BI,商业智能有什么区别
所属栏目:[大数据] 日期:2020-12-31 热度:88
人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出[详细]
-
如何用大数据实现用户价值的最大化
所属栏目:[大数据] 日期:2020-12-31 热度:126
副标题#e# 来源:易观智库 1 大数据中的用户分析 首先,我们为什么要去做用户分析?面临繁琐的数据之中,需要做什么分析?怎么去提取数据?在建立用户画像模型的过程中,区分用户特征的关键点是什么?应该从哪些方面去寻找用户的特征?其实这个问题扩大化以[详细]
-
[bigdata-029] 在centos 7上安装maria
所属栏目:[大数据] 日期:2020-12-31 热度:94
centos 7以上版本支持mysql的另一个分支maria 安装方式如下 正确安装mariadb http://blog.csdn.net/default7/article/details/39138139 http://blog.csdn.net/default7/article/details/41973887 yum install mariadb* service mariadb.service start syst[详细]
