|
3月前
|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,便宜云服务器人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

321
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 数据采集 人工智能
|

设计文档:智能化医疗设备数据分析与预测维护系统

本系统的目标是构建一个基于人工智能的智能化医疗设备的数据分析及预测维护平台,实现对医疗设备运行数据的实时监控、高效处理和分析,提前发现潜在问题并进行预防性维修,从而降低故障率,提升医疗服务质量。

7 1
|
1小时前
|
SQL 数据可视化 大数据
|

从数据小白到大数据达人:一步步成为数据分析专家

从数据小白到大数据达人:一步步成为数据分析专家

37 30
|
1小时前
|
存储 供应链 安全
|

区块链技术在选举中的应用:透明与安全的新时代

区块链技术在选举中的应用:透明与安全的新时代

18 12
|
15小时前
|
存储 分布式计算 Hadoop
|

MPP 架构与 Hadoop 架构技术选型指南

MPP架构与Hadoop架构是处理海量数据的两大选择。MPP通过大规模并行处理实现快速查询响应,适用于企业级数据仓库和OLAP应用;Hadoop则以分布式存储和计算为核心,擅长处理非结构化数据和大数据分析。两者各有优劣,MPP适合结构化数据和高性能需求场景,而Hadoop在扩展性和容错性上表现更佳。选择时需综合考虑业务需求、预算和技术能力。

30 14
|
15小时前
|
关系型数据库 OLAP OLTP
|

深入剖析 OALP 与 OLTP:概念、区别、技术、场景

本文深入剖析了OLTP(在线事务处理)与OLAP(在线分析处理)的概念、区别、技术及应用场景。OLTP专注于实时业务操作,确保数据一致性和高效性,适用于金融、电商等行业;OLAP则侧重于历史数据分析,支持复杂查询和多维分析,助力企业决策。两者在数据特点、系统设计、用户类型及数据库设计上存在显著差异。合理结合OLTP和OLAP,可提升企业的运营效率和决策水平。

25 13
|
15小时前
|
存储 SQL NoSQL
|

Doris 架构原理及核心特性详解

Doris 是百度内部孵化的OLAP项目,现已开源并广泛应用。它采用MPP架构、向量化执行引擎和列存储技术,提供高性能、易用性和实时数据处理能力。系统由FE(管理节点)和BE(计算与存储节点)组成,支持水平扩展和高可用性。Doris 适用于海量数据分析,尤其在电商、游戏等行业表现出色,但资源消耗较大,复杂查询优化有局限性,生态集成度有待提高。

20 13
|
15小时前
|
存储 监控 druid
|

Druid、ClickHouse、Doris、StarRocks 的区别与分析

本文对比了 Druid、ClickHouse、Doris 和 StarRocks 四款大数据分析引擎。它们均为 OLAP 引擎,采用列式存储和分布式架构,适用于海量数据分析。Druid 擅长实时分析与高并发查询;ClickHouse 以超高性能著称,适合复杂查询;Doris 提供易用的 SQL 接口,性能均衡;StarRocks 则以其极速查询和实时更新能力脱颖而出。各引擎在数据模型、查询性能、数据更新和存储方面存在差异,适用于不同的业务场景。选择时需根据具体需求综合考虑。

32 17
|
15小时前
|
存储 消息中间件 druid
|

Druid 架构原理及核心特性详解

Druid 是一个分布式、支持实时多维OLAP分析的列式存储数据处理系统,适用于高速实时数据读取和灵活的多维数据分析。它通过Segment、Datasource等元数据概念管理数据,并依赖Zookeeper、Hadoop和Kafka等组件实现高可用性和扩展性。Druid采用列式存储、并行计算和预计算等技术优化查询性能,支持离线和实时数据分析。尽管其存储成本较高且查询语言功能有限,但在大数据实时分析领域表现出色。

28 19
|
15小时前
|
存储 缓存 监控
|

ClickHouse 架构原理及核心特性详解

ClickHouse 是由 Yandex 开发的开源列式数据库,专为 OLAP 场景设计,支持高效的大数据分析。其核心特性包括列式存储、字段压缩、丰富的数据类型、向量化执行和分布式查询。ClickHouse 通过多种表引擎(如 MergeTree、ReplacingMergeTree、SummingMergeTree)优化了数据写入和查询性能,适用于电商数据分析、日志分析等场景。然而,它在事务处理、单条数据更新删除及内存占用方面存在不足。

33 21
|
19小时前
|
存储 数据采集 分布式计算
|

大数据是什么?用浅显的语言揭开神秘面纱

大数据是什么?用浅显的语言揭开神秘面纱

23 11
|
19小时前
|
存储 人工智能 安全
|

基于区块链的数字身份认证:重塑身份安全的新范式

基于区块链的数字身份认证:重塑身份安全的新范式

21 15
|
22小时前
|
数据采集 JSON 数据格式
|

Python爬虫:京东商品评论内容

京东商品评论接口为商家和消费者提供了重要工具。商家可分析评论优化产品,消费者则依赖评论做出购买决策。该接口通过HTTP请求获取评论内容、时间、点赞数等数据,支持分页和筛选好评、中评、差评。Python示例代码展示了如何调用接口并处理返回的JSON数据。应用场景包括产品优化、消费者决策辅助、市场竞争分析及舆情监测。

20 5
|
1天前
|
分布式计算 大数据 数据挖掘
|

大数据的第一步:初学者指南

大数据的第一步:初学者指南

93 68
|
1天前
|
存储 安全 数据管理
|

区块链在医疗数据管理中的应用:安全与隐私的新纪元

区块链在医疗数据管理中的应用:安全与隐私的新纪元

29 16
|
1天前
|
机器学习/深度学习 监控 数据可视化
|

提升数据科学工作流效率的10个Jupyter Notebook高级特性

Jupyter Notebooks 是数据科学家和Python开发人员的核心工具,提供代码执行、文本编辑和数据可视化的无缝整合。本文介绍其高级功能,如Magic命令优化代码执行、IpyWidgets增强交互性、自动重载模块更新、内联文档系统、可折叠标题、nbconvert多格式转换、变量监控、JupyterLab集成开发环境、终端集成和调试系统等,助您提升工作效率并充分发挥Jupyter的潜力。

34 22
|
1天前
|
JSON 搜索推荐 API
|

京东店铺所有商品接口系列(京东 API)

本文介绍如何使用Python调用京东API获取店铺商品信息。前期需搭建Python环境,安装`requests`库并熟悉`json`库的使用。接口采用POST请求,参数包括`app_key`、`method`、`timestamp`、`v`、`sign`和业务参数`360buy_param_json`。通过示例代码展示如何生成签名并发送请求。应用场景涵盖店铺管理、竞品分析、数据统计及商品推荐系统,帮助商家优化运营和提升竞争力。

33 23
|
2天前
|
DataWorks
|

DataWorks任务如何现在执行最长时间?

设置任务执行最长时间

44 29
来自: 人工智能平台PAI  版块
|
2天前
|
机器学习/深度学习 PyTorch 测试技术
|

LossVal:一种集成于损失函数的高效数据价值评估方法

LossVal是一种创新的机器学习方法,通过在损失函数中引入实例级权重,直接在训练过程中评估数据点的重要性,避免了传统方法中反复重训练模型的高计算成本。该方法适用于回归和分类任务,利用最优传输距离优化权重,确保模型更多地从高质量数据中学习。实验表明,LossVal在噪声样本检测和高价值数据点移除等任务上表现优异,具有更低的时间复杂度和更稳定的性能。论文及代码已开源,为数据价值评估提供了高效的新途径。

28 13
|
2天前
|
定位技术
|

探秘站点检测访问中代理 IP 的实用技巧

随着互联网发展,使用代理IP的需求增加。站点检测代理IP的方法包括:1. IP地址黑名单;2. HTTP头部检查(如X-Forwarded-For);3. 行为分析;4. 地理位置检测;5. CAPTCHA验证;6. 连接特征分析。这些技术帮助网站判断访问是否来自代理。

21 6
来自: 大数据计算 MaxCompute  版块
|
2天前
|
机器学习/深度学习 人工智能 编译器
|

BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术

本文介绍了便宜云服务器 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分:Dynamic Shape 场景下显存优化的背景与挑战;BladeDISC++的创新解决方案;Llama2 模型的实验数据分析

18 3
来自: 人工智能平台PAI  版块
|
2天前
|
小程序 IDE PHP
|

圈子源码如何打包生成App小程序/开发一个圈子系统软件所需要的费用体现在哪里?

将PHP源码打包成App的过程涉及多个步骤和技术选择。以圈子源码为例,首先明确需求,确定App功能和目标用户群体,并根据需求开发小程序页面,如用户注册、圈子列表等。源码准备阶段确保源码适用于小程序开发,环境配置需安装IDE(如微信开发者工具)及依赖库。最后在IDE中打包小程序并上传至管理平台,通过审核后发布。费用方面,模板开发成本较低,定制开发则更高,具体取决于需求复杂度和第三方服务费用。

14 0
|
2天前
|

如何看PAI产品下训练(train)模型任务的费用细节

PAI产品下训练(train)模型任务的费用细节

17 4
来自: 人工智能平台PAI  版块
|
3天前
|
数据采集 存储 分布式计算
|

解密大数据:从零开始了解数据海洋

解密大数据:从零开始了解数据海洋

38 17
|
3天前
|
存储 搜索推荐 关系型数据库
|

ElasticSearch 详解

ElasticSearch 是一款优秀的开源搜索引擎,适用于大数据场景下的高效检索与分析。其分布式架构、实时搜索和灵活的数据分析功能使其能处理 PB 级数据量。相比 Solr,ES 在实时性、分布式架构和文档处理上更具优势。核心概念包括索引、文档、分片和副本等。ES 使用倒排索引实现快速搜索,区别于正向索引。与关系型数据库相比,ES 更适合非结构化数据和全文搜索。总结来说,ES 在电商搜索、日志分析等领域有广泛应用,未来有望带来更多创新。

51 19
|
3天前
|
SQL 监控 关系型数据库
|

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享,介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长,公司面临数据库性能瓶颈及实时数据处理需求,通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题,并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。

233 22
来自: 实时计算 Flink  版块
|
3天前
|
机器学习/深度学习 运维 数据可视化
|

Python时间序列分析:使用TSFresh进行自动化特征提取

TSFresh 是一个专门用于时间序列数据特征自动提取的框架,支持分类、回归和异常检测等机器学习任务。它通过自动化特征工程流程,处理数百个统计特征(如均值、方差、自相关性等),并通过假设检验筛选显著特征,提升分析效率。TSFresh 支持单变量和多变量时间序列数据,能够与 scikit-learn 等库无缝集成,适用于大规模时间序列数据的特征提取与模型训练。其工作流程包括数据格式转换、特征提取和选择,并提供可视化工具帮助理解特征分布及与目标变量的关系。

36 16
|
3天前
|
SQL 弹性计算 分布式计算
|

便宜云服务器 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%

便宜云服务器开源大数据平台 E-MapReduce 重磅推出托管弹性伸缩功能,基于 EMR 托管弹性伸缩功能,您可以指定集群的最小和最大计算限制,EMR 会持续对与集群上运行的工作负载相关的关键指标进行采样,自动调整集群大小,以获得最佳性能和资源利用率。

38 15
|
3天前
|
机器学习/深度学习 传感器 搜索推荐
|

黑神话悟空与机器学习?

《黑神话:悟空》通过先进技术将中国名胜古迹和传统文化融入游戏,如山西小西天、重庆大足石刻等,为玩家提供独特文化体验,推动当地旅游业发展。这表明游戏可作为文化载体,结合大数据技术,在文化遗产保护、文化旅游、文化创意及公共文化服务方面实现智能化与便捷化,促进文化产业质变。

10 0
|
3天前
|
机器学习/深度学习 存储 人工智能
|

人工智能的三大主义

人工智能的三大主义之一——符号主义,通过数学和逻辑符号构建表达式以模拟人类思维。其代表性成果包括1956年的“逻辑理论家”程序和上世纪80年代的专家系统。1997年,“深蓝”计算机击败国际象棋冠军卡斯帕罗夫,是符号主义在博弈领域的巅峰之作。然而,由于人类智能的复杂性和广泛性,符号主义难以完全模拟人类感知和潜智能,逐渐走向衰落。

19 0
|
3天前
|
机器学习/深度学习 人工智能 算法
|

人工智能的三大主义--——行为主义(actionism),连接主义 (connectionism)

这段内容涵盖了人工智能领域的重要概念和历史节点。首先介绍了布鲁克斯的六足行走机器人及Spot机器狗,被视为新一代“控制论动物”。接着解释了感知机作为最简单的人工神经网络,通过特征向量进行二分类。1974年,沃伯斯提出误差反向传播(BP)算法,利用梯度调整权重以优化模型。最后,阐述了符号主义、连接主义和行为主义三大学派的发展与融合,强调它们在持续学习中共同推动人工智能的进步。

14 0
|
3天前
|
SQL 人工智能 数据可视化
|

数据分析之年度总结分享

国内一家服装公司,年销售额达数千万元,覆盖七个区域。财年后需分析销售数据以指导下年度战略。传统工作流涉及业务人员与BI研发协作,但存在沟通、分析和制作困难。为解决这些问题,采用便宜云服务器DataV Note进行智能数据分析。该工具支持多人协作、AI驱动的可视化分析,并能数字化沉淀成果,极大提升了效率和美观度。通过对比不同品类销售额、品牌占比及地区业绩等维度,最终生成专业报告,满足多样化汇报需求。总结来看,DataV Note提供了高效、智能的数据分析解决方案。

23 0
|
4天前
|

便宜云服务器产品十二月刊

通义千问VL图片理解大模型部分规格降价,PAI 灵骏智算资源配额支持多个VSW,对象存储 OSS 资源池 QoS 发布,多款产品能力新升级,详情请点击便宜云服务器产品十二月刊

11
|
4天前
|
算法 数据可视化 安全
|

基于DWA优化算法的机器人路径规划matlab仿真

本项目基于DWA优化算法实现机器人路径规划的MATLAB仿真,适用于动态环境下的自主导航。使用MATLAB2022A版本运行,展示路径规划和预测结果。核心代码通过散点图和轨迹图可视化路径点及预测路径。DWA算法通过定义速度空间、采样候选动作并评估其优劣(目标方向性、障碍物距离、速度一致性),实时调整机器人运动参数,确保安全避障并接近目标。

93 68
|
4天前
|
存储 监控 算法
|

Flink 四大基石之 Checkpoint 使用详解

Flink 的 Checkpoint 机制通过定期插入 Barrier 将数据流切分并进行快照,确保故障时能从最近的 Checkpoint 恢复,保障数据一致性。Checkpoint 分为精确一次和至少一次两种语义,前者确保每个数据仅处理一次,后者允许重复处理但不会丢失数据。此外,Flink 提供多种重启策略,如固定延迟、失败率和无重启策略,以应对不同场景。SavePoint 是手动触发的 Checkpoint,用于作业升级和迁移。Checkpoint 执行流程包括 Barrier 注入、算子状态快照、Barrier 对齐和完成 Checkpoint。

57 20
来自: 实时计算 Flink  版块
|
4天前
|
缓存 监控 数据处理
|

Flink 四大基石之窗口(Window)使用详解

在流处理场景中,窗口(Window)用于将无限数据流切分成有限大小的“块”,以便进行计算。Flink 提供了多种窗口类型,如时间窗口(滚动、滑动、会话)和计数窗口,通过窗口大小、滑动步长和偏移量等属性控制数据切分。窗口函数包括增量聚合函数、全窗口函数和ProcessWindowFunction,支持灵活的数据处理。应用案例展示了如何使用窗口进行实时流量统计和电商销售分析。

56 28
来自: 实时计算 Flink  版块
|
4天前
|
边缘计算 网络安全 数据安全/隐私保护
|

从当前创新看HTTP代理的未来发展格局

在数字化时代,网络安全与隐私保护成为核心需求。HTTP代理凭借智能化、安全性、边缘计算等创新技术,支持HTTP/2、HTTP/3等新兴协议,优化用户体验,提升数据传输安全性和效率,满足现代网络需求。

31 13
来自: 大数据计算 MaxCompute  版块
|
4天前
|
弹性计算
|

便宜云服务器

14 0
|
4天前
|
数据可视化 JavaScript 前端开发
|

HttpClient和HttpGet实现音频数据的高效爬取与分析

HttpClient和HttpGet实现音频数据的高效爬取与分析

18 0
来自: 大数据计算 MaxCompute  版块
|
4天前
|
存储 人工智能 安全
|

面向法律场景的大模型 RAG 检索增强解决方案

检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向法律场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和教育领域的 RAG 解决方案。

39 0
来自: 人工智能平台PAI  版块
|
4天前
|
边缘计算 负载均衡 监控
|

静态代理IP与动态网络拓扑的协同发展

随着科技和互联网的发展,越来越多企业依赖代理服务。静态代理IP与网络拓扑结构的有效融合能显著提升网络性能、安全性和管理效率。通过合理设计网络拓扑、分配静态代理IP,并结合监控和安全策略,可优化数据流、实现负载均衡,确保高效安全的数据传输。未来,云计算、边缘计算及AI技术将进一步推动这一融合,形成更灵活高效的网络架构。

15 1
来自: 大数据计算 MaxCompute  版块
|
4天前
|
API Python
|

京东拍立淘图片搜索商品接口系列(京东 API)

简介:本文介绍了如何使用拍立淘图片搜索 API 在京东平台上查找相似商品。首先需安装 Python 库 `requests`,并通过内置库 `hashlib` 生成签名。API 支持通过图片 URL 或 Base64 编码的图片进行搜索,返回商品名称、价格等信息。示例代码展示了如何构建请求并处理响应。应用场景包括电商购物助手和竞品分析,帮助用户和商家提高购物效率和市场竞争力。

18 0
|
4天前
|
JSON 监控 API
|

京东商品列表 API 接口系列(京东 API)

本简介介绍了使用 Python 调用京东商品搜索和详情 API 的方法。首先需安装 `requests` 库,`hashlib` 和 `time` 为内置库无需安装。API 支持按关键词、类别等条件搜索商品,返回 JSON 格式的商品列表,包括 ID、名称、价格等信息。通过商品 ID 可获取详细信息如描述、规格等。示例代码展示了如何生成签名并发送请求。应用场景包括市场调研、竞品监测和价格预警等,为企业决策提供数据支持。

15 0
|
4天前
|
自然语言处理 调度 决策智能
|

Coconut:基于连续潜在空间推理,提升大语言模型推理能力的新方法

Coconut提出了一种新的大语言模型推理范式,通过在潜在空间中运算,利用隐藏层生成的连续思维状态取代传统文本推理。该方法采用广度优先搜索探索多条路径,避免单一路径局限,显著提升逻辑任务性能并减少token消耗。 Coconut结合“语言模式”和“潜在模式”动态切换,通过多阶段课程学习优化推理能力,在复杂规划任务中表现卓越,尤其在GSM8k和ProsQA等任务中优于传统模型。实验表明,Coconut能有效捕获中间变量,减少幻觉错误,具备更强的推理规划能力。

16 2
|
4天前
|
程序员 人工智能
|

ai 程序员写到一半就提示已取消

28 0
|
5天前
|
供应链 算法 安全
|

探索区块链技术中的隐私保护机制

探索区块链技术中的隐私保护机制

47 27
|
5天前
|
传感器 监控 数据挖掘
|

Flink 四大基石之 Time (时间语义) 的使用详解

Flink 中的时间分为三类:Event Time(事件发生时间)、Ingestion Time(数据进入系统时间)和 Processing Time(数据处理时间)。Event Time 通过嵌入事件中的时间戳准确反映数据顺序,支持复杂窗口操作。Watermark 机制用于处理 Event Time,确保数据完整性并触发窗口计算。Flink 还提供了多种迟到数据处理方式,如默认丢弃、侧输出流和允许延迟处理,以应对不同场景需求。掌握这些时间语义对编写高效、准确的 Flink 应用至关重要。

61 21
来自: 实时计算 Flink  版块
|
5天前
|
消息中间件 关系型数据库 MySQL
|

Flink?CDC?在便宜云服务器实时计算Flink版的云上实践

本文整理自便宜云服务器高级开发工程师阮航在Flink Forward Asia 2024的分享,重点介绍了Flink CDC与实时计算Flink的集成、CDC YAML的核心功能及应用场景。主要内容包括:Flink CDC的发展及其在流批数据处理中的作用;CDC YAML支持的同步链路、Transform和Route功能、丰富的监控指标;典型应用场景如整库同步、Binlog原始数据同步、分库分表同步等;并通过两个Demo展示了MySQL整库同步到Paimon和Binlog同步到Kafka的过程。最后,介绍了未来规划,如脏数据处理、数据限流及扩展数据源支持。

112 0
来自: 实时计算 Flink  版块
|
5天前
|
机器学习/深度学习 数据可视化 数据挖掘
|

使用Python实现基于矩阵分解的长期事件(MFLEs)时间序列分析

在现代数据分析中,高维时间序列数据的处理和预测极具挑战性。基于矩阵分解的长期事件(MFLEs)分析技术应运而生,通过降维和时间序列特性结合,有效应对大规模数据。MFLE利用矩阵分解提取潜在特征,降低计算复杂度,过滤噪声,并发现主要模式。相比传统方法如ARIMA和深度学习模型如LSTM,MFLE在多变量处理、计算效率和可解释性上更具优势。通过合理应用MFLE,可在物联网、金融等领域获得良好分析效果。

22 0
http://www.vxiaotou.com