如何在R中处理海量数据？

在R中处理海量数据可以采用以下几种方法：

分块处理：将海量数据分成若干个块，逐个处理。这种方法适用于无法一次性加载所有数据到内存的情况。可以使用R的数据处理包如data.table和dplyr，利用它们提供的函数进行分块处理。此外，可以使用R的并行计算库如parallel和foreach，将处理任务分发到多个计算核心上进行并行处理。
压缩存储：对于海量数据，可以考虑采用压缩存储格式，以节省存储空间并加快数据读取速度。R中常用的压缩存储格式包括feather、fst和HDF5等。这些格式支持高效的数据存储和读取，可以大大提高处理海量数据的效率。
数据库连接：将海量数据存储在关系型数据库中，通过R的数据库连接库如RMySQL和RPostgreSQL连接数据库，使用SQL语句对数据进行查询和处理。这种方法适用于数据量大且需要频繁查询和更新的场景。
并行计算：利用R的并行计算库进行并行处理，将任务分发到多个计算核心或计算节点上同时进行处理。R中常用的并行计算库包括parallel和foreach等。通过并行计算可以充分利用计算资源，提高处理海量数据的效率。
分布式计算：使用R的分布式计算框架如SparkR和dask，将任务分发到多个计算节点上进行并行处理。这种方法适用于数据量特别大且需要更高的计算性能的场景。
内存优化：对于无法一次性加载到内存的海量数据，可以通过优化内存使用来提高处理效率。可以使用R的bigmemory和ff等包来处理大型数据集，它们可以将数据存储在磁盘上，并提供高效的数据操作接口。
使用其他工具：除了R，还可以结合其他工具来处理海量数据。例如，可以使用Hadoop和Spark等大数据处理框架，将数据分布式存储和处理。此外，还可以使用Python的pandas和numpy等库，或者使用Scala的Spark来处理数据。

总结起来，在R中处理海量数据需要采用分块处理、压缩存储、数据库连接、并行计算、分布式计算、内存优化等策略来提高处理效率和减少内存占用。根据具体场景选择适合的方法和工具，可以更好地处理海量数据。

页面内容是否对你有帮助？

有帮助

没帮助

当重塑大量数据时，提升循环性能

、、、

这是以前问题中的一个扩展问题。我正在根据下面的代码重塑数据。但是随着数据大小的增加，in=rand(291081,1920);，在前面问题中的答案(预分配)不能再处理了，MATLAB甚至冻结了整个笔记本电脑。因此，正如泰迪在最后一个问题中所建议的，我正在打开一个新的问题来提高循环的性能。一些非常相似但并非相似的问题可以在中找到。由此，给出的答案建议将循环修改为按列排列。但是，由于我的循环需要同时访问行和列，所以答案似乎不适用于我的情况。该循环是否仍然可以修改以提高其性能？或者这个循环可以在不冻结整个笔记本电脑的情况下完成吗？如果可能的话，不涉及GPU。 in=rand(291081,192

浏览 3提问于2017-04-02得票数 1

回答已采纳

2回答

如何在循环中运行Synctask

、、、、

在我的应用程序中，我需要与服务器同步数据库，那里有大量的记录(大约300k)。我使用分页的概念通过doInBackground()中的AsyncTask和Http连接在我的应用程序中下载数据。我想同时下载页面并保存到数据库中。像下面这样在循环中运行AsynTask是一种好方法，还是有更好的方法呢？ for (int i = 0 ;i <totalPage ; i++){ updateRecords(i); } private void updateRecords(int page) { UpdateRecordsAsyncTask updateRecordsAsync

浏览 0提问于2016-03-08得票数 0

1回答

处理大量数据

、、、

因此，我正在使用参数化能量模拟，并最终得到存储在.CSV文件中的数据的500GB+。我需要能够处理所有这些数据来比较结果，并深入了解不同参数的影响。每个csv文件名都包含用于模拟的参数信息，因此我无法合并这些文件。我通常使用pandas并定义一个类将.csv文件加载到python中。但是现在(有了所有这些数据)没有足够的内存来做这件事。你能告诉我一种处理这些数据的方法吗？我需要能够做绘图和比较csv文件。谢谢您抽时间见我。

浏览 3提问于2016-10-01得票数 0

1回答

如何在使用OracleCachedRowSet的模型中加速排序JTable？

、、、、

我正在使用带有模型的JTable，该模型通过OracleCachedRowSet实现在cachedRowSet中保存数据。在getValueAt()方法中，我需要使用cachedRowSet.absolute()方法来将rowSet指针移动到所需的行。cachedRowSet.absolute()似乎非常慢，当我对有很多行的表(使用java默认排序器)进行排序时，它使排序过程变得非常慢，以至于可能需要几秒钟的时间。有没有人有办法加快排序过程(有没有办法不在getValueAt()中使用absolute()或者加速absolute()方法)？以下是使用absloute()方法的getValu

浏览 0提问于2011-11-15得票数 0

1回答

发送大量数据- java解决方案

、、、、

我目前正在寻找解决方案，以便在无线网络中发送大量数据。这应该是使用java完成的，并且还应该能够在Android上运行。要发送的数据仅为文本，但它应该能够处理发送的大量包。这些数据将通过本地网络从不同的android设备(电话和平板电脑)发送出去。直到现在，我遇到了以下“工具”/api：远程方法调用：，快速：但显然，如果我需要的东西已经存在，我不想开发我自己的数据传输协议/工具。因此，我的问题是:你们中的一些人是否有过这样的经验，或者可以推荐一些很好的工具/api来达到这个目的？(当然，成绩是我的第一要务，但使用越简单越好) (预先谢谢:)

浏览 2提问于2014-02-11得票数 1

回答已采纳

2回答

如何将R数据集(例如: MASS、ISLR等库中的数据集)保存到csv文件中

、、、

如何将r库中提供的数据集提取到csv文件中。当试图在python中实现与R相关的数据分析程序时，就面临着这个问题。

浏览 11提问于2022-09-13得票数 0

回答已采纳

1回答

数据摄取-使用并发进行大规模并行处理

、、、

我正在寻找一个具有并发的大规模并行处理系统，它可以为每500毫秒100多万台IoT设备提供无缝的数据摄取解决方案。寻找开源的、高度可扩展的、不同协议的丰富的库，支持ESB，并且可以无故障地管理多线程。是阿帕奇光束，阿帕奇Nifi或阿帕奇骆驼或WSO2更好的选择。

浏览 2提问于2018-07-30得票数 0

1回答

Apache Spark与MapReduce

、、

我一直在查找Spark和MapReduce之间的区别，我真正发现的是Spark在内存和磁盘上运行，这使得它的速度大大加快。我还读到，MapReduce对于非常庞大的数据集更好，这仅仅是因为你可以将更多的数据加载到磁盘上而不是内存中？但想必，使用Spark，您无论如何都会在内存和磁盘之间移动数据，因此如果内存空间不足，您可以将一些数据移回磁盘，然后引入新数据进行处理。基本上，还有没有真正的理由继续使用MapReduce？

浏览 0提问于2018-05-02得票数 0

1回答

如何在asp.net mvc中将大数据集从控制器加载到视图

、、、、

有没有办法在ASP.net MVC中使用ajax加载超过2MB的数据(15000条记录)？在ajax调用中，如果数据大于2MB，ajax响应将为空，如果小于2MB，则为完美。我在我的web.config中添加了以下内容 <system.web.extensions> <scripting> <webServices> <jsonSerialization maxJsonLength="2147483644" /> </webServices> &

浏览 2提问于2016-04-15得票数 1

1回答

使用PHP mail()的效果

、

我有一个项目，我使用PHP内置的mail()函数发送电子邮件，我一次只发送一个电子邮件，只使用少量的HTML和非常有限的CSS (两个表格和一些CSS在头部用于样式)，但服务器似乎执行得非常慢(以至于管理员发送电子邮件的页面经常超时) 所以我的问题是: mail()给服务器带来了很高的工作负载(不确定这是不是正确的术语)，或者仅仅是我正在使用的服务器是垃圾？这是否值得我研究一下像这样的项目呢？编辑：下面是有问题的代码： $query = "SELECT email FROM $a_table WHERE id='$Id'"; $result

浏览 0提问于2012-01-30得票数 0

回答已采纳

4回答

数据集和数据库有什么区别？

、

数据集和数据库之间的区别是什么？如果它们是不同的，那么如何呢？为什么现在使用数据库很难管理海量数据？！请回答独立于任何编程语言。

浏览 2提问于2011-10-16得票数 19

回答已采纳

1回答

一种每天分析和计算Oracle海量数据的方法

、、

我需要计算核心引擎的主Oracle数据库中各种事务表的汇总数据。我计划写这作为一个多线程的Java程序，这将作为一个作业，每天午夜运行的调度；该程序将从各种事务日志表与其他表从数据库中提取数据，计算和存储回一个单独的表的结果。日志表通常包含数百万个数据，其中一些表按天分区，另一些表按月分区。 GUI (仪表板)平台将通过单独的The服务请求这些信息，该the服务已经存在，用于提供各种其他详细信息。项目中几乎所有的模块都使用Spring框架，所以我想使用具有调度功能的Spring-Batch。在开始设计之前，我开始了一些研究，我发现使用了各种其他技术，例如ETL工具、数据库本身中的调度、实时数据

浏览 1提问于2015-07-21得票数 0

2回答

大型表修复/索引和myisam_sort_buffer_size

我有一个使用MySQL引擎的MyISAM表，其中包含6个INT列、1个SMALLINT、2个TINYINT和1个浮动列。它有数十亿行(数据文件为100 is )。我试图通过启用键对所有列进行索引，但这种情况从未发生过。尝试"myisamchk -r tableName“会产生以下错误： - recovering (with sort) MyISAM-table 'tableName' Data records: 662929483

浏览 3提问于2012-10-11得票数 8

2回答

在线学习w/特征加权/调整

、、

假设我有一个有监督的学习问题，有一系列的特征和标签。首先，我学习的培训数据，然后我决定流的数据，逐点和做在线学习。是否有可能在每个数据点进入时更新权重或计算特性重要性？另外，什么在线学习算法可以让我做到这一点，这可以用Python完成吗？

浏览 0提问于2017-01-04得票数 1

回答已采纳

1回答

VBA匹配工作簿A和B中的值，返回工作簿B中的另一个值

、、

我有两本练习册A和B。工作簿A是客户发票列表(5000行)。客户ID在A列。工作簿B是客户详细信息，由15000行和100列组成。客户ID位于B列。使用客户ID，我尝试将工作簿B中的D、E、G、O、AA、AD、AF、BD、CA (客户地址、电话、电子邮件)列的数据复制到工作簿A的F到N列。我一直在使用vlookup，但它太耗时了，因为数据每天都会刷新，我需要一次又一次地重新输入公式。我尝试使用VBA循环函数，但它超时(数据太大)。我尝试了各种方法，比如匹配函数，我似乎不能得到结果。下面是我尝试过的代码。很抱歉，我是VBA的新手。我认为对于这样的大数据，不鼓励使用双循环。客户数据100

浏览 1提问于2017-08-08得票数 0

1回答

在Jupyter Notebook中读取一个巨大的.csv文件

、、、、

我正在尝试从Jupyter Notebook (Python)的.csv文件中读取数据。 .csv文件大小为8.5G，7000万行，30列当我尝试读取.csv时，我得到了错误。以下是我的代码 import pandas as pd log = pd.read_csv('log_20100424.csv', engine = 'python') 我也试过使用pyarrow，但它不起作用。 import pandas as pd from pyarrow import csv` log = csv.read('log_20100424.csv

浏览 136提问于2020-04-24得票数 1

1回答

如何从web抓取器将海量数据保存到数据库

、、、

我正在抓取一个包含2M数据的网页，用Watir滚动页面，而不是用Nokogiri获取数据。我可以通过一次请求获取所有数据。我需要将所有数据保存到数据库中。我想知道哪种方法是最快的。我是否应该制作一个类似这样的each： users = doc.css('div.container > div ') users.each do |a| User.name = a.css('p.name').text User.age = a.css('p.surname').text User.save! end 或者首先，将数据存储

浏览 0提问于2019-08-22得票数 0

1回答

如何在数据库中保存多列

、

我有一个文本文件。我需要从这个文本文件中获取数据并显示在网格上， 1)After this user can update information from gridview, 2)Click on save button save data on database. 在点击按钮数据之前，不要保存在database.How上这样做？

浏览 0提问于2010-05-19得票数 1

回答已采纳

1回答

Apache Hadoop与Google Bigdata

、、、、

有谁能解释一下Apache和Google之间的关键区别吗？哪个更好(hadoop还是google大数据)。

浏览 1提问于2015-05-16得票数 9

回答已采纳

1回答

有多少数据可以成为海量数据？高维可以有多少个维度？

我现在要成为一名硕士了，我的老师的研究方向是对高维海量数据进行数据挖掘。但我仍然无法想象什么是海量数据，以及多少维可以被称为高维。 tks~

浏览 1提问于2011-06-22得票数 0

1回答

如何忽略配置单元中的顶点失败错误

、

当我从一个hive表(其中有vertex failed数据)插入时，我得到了“JSON”错误。我假设表中的数据可能已损坏。如果发生错误，我希望忽略它。我怎么能在hive中忽略它呢？

浏览 0提问于2018-06-01得票数 0

1回答

在R中使用RJDBC导入数据时定义列类

、、、、

我正在尝试从R中的HANA数据库导入一个非常大的数据集。RJDBC包的一个问题是，所有包含字符的列都被加载为字符列类型。在我们的例子中，将列作为一个因子加载会更有效，因为只有几个唯一的值。是否可以在RJDBC调用中的某个地方定义col类，以及col类转换是在哪里执行的？如果在HANA中执行到因子的转换，那就太好了，因为这将减少必须传输到R的GB的数量。示例代码： dbFetch(dbSendQuery(conn = hana_connection, statement = 'select CHAR_COL FROM TABLE_NAME')) 在文档中，他们讨论的是所需的DBM

浏览 7提问于2017-07-31得票数 0

1回答

100 TeraBytes容量数据库-资源和时间估计

、、

我正在为100 on报告数据库设置进行“信封背面”计算。我正在从这里的专家那里寻找想法。拟议环境：存储容量~100 表~ 200，大小从1GB到5TB不等。平均大小可在100 lie 200 lie之间。 ETL -作业可能需要数以百万行为单位的10's表之间的连接，连接键从10字节到500字节不等。这种连接应在2-5分钟内完成。现场选择-最初，只对选定的速度感兴趣。应该支持500选择/秒。更新/秒将是相对较小的数目，可以忽略此练习。需要24x7可用性。应该有两个独立的DB服务器来提供选择调用(有数据复制)。问题：目前，我正在看甲骨文。对于大型数据库的其他商业(或)开源解决方

浏览 0提问于2012-03-18得票数 10

回答已采纳

2回答

如何排序和删除重复的URL(文件包含大约100亿个URL)！

、、、

正如标题所说，如何对文件进行排序？如果你的PC内存只有2 2GB，但是有100亿个URL (假设最长的URL是256个字符)。

浏览 1提问于2014-07-18得票数 0

1回答

什么是客户端和服务器端的DataTable处理？

、、、

我曾尝试过，但在谷歌和这里的研究失败，以获得一个基本的，但很好地理解客户端和服务器端jQuery dataTable处理的含义。我知道客户机通常是web浏览器，它与用户交互，服务器是http服务器，但仅此而已。如果有人能帮助对数据处理的两个方面做一个简短的描述？如果有例子的话，那就太棒了。如果不是的话，还是很棒。 <table id="datatable" class="table"> <thead> <tr> <th> @Html.DisplayNameFo

浏览 5提问于2017-03-12得票数 2

回答已采纳

3回答

如何在android中持久化数据，而不使用SQLite

、

我想持久化数据，而不使用SQLite数据库。我能为这份工作做些什么？

浏览 4提问于2011-08-09得票数 0

回答已采纳

1回答

在HTML5 JavaScript Worker中创建标记的HTML5网格

、、、、

我在基于商业智能的web仪表板上工作，我已经尝试了几个第三方JavaScript网格，即JQGrid，ng-grid。问题是，当网格试图使用大数据对象进行渲染时，它会卡住并使浏览器崩溃。现在我正在考虑使用HTML5 web-worker编写我自己的网格，它将从数据对象中创建html标记字符串，然后传递到主对象并附加到DOM中。请写下关于此方法的建议，并命名使用此方法的网格。谢谢

浏览 0提问于2014-05-07得票数 3

1回答

如何在Numpy中加速行选择？

、

我有一个非常大的数据集raw，我最初选择的行如下所示： raw = np.array(Some Matrix) selected = [r for r in raw if r[1] == '20130525' and r[2] < 120000] 但这真的很慢，有人知道如何使用Numpy的内置函数来加快速度吗？

浏览 2提问于2013-08-05得票数 2

1回答

使用python进行高维孤立点检测

、、

谁能给我介绍一个健壮的python实现算法，比如Robust-PCA或基于角度的离群值检测(ABOD)？我尝试了几个Robust-PCA的python实现，但它们被证明是非常占用内存的，程序崩溃了。我的数据集是60,000×900个浮点数。R有一个ABOD的实现，但我想坚持使用python。

浏览 0提问于2017-07-14得票数 3

2回答

如何在服务器端拦截和修改HTTP响应？

、、

我正在使用一个使用HTTP的客户机/服务器应用程序，我的目标是为它添加新功能。我可以通过将我自己的代码挂接到一些特定的事件来扩展客户端，但不幸的是服务器是不可定制的。客户端和服务器都在Windows环境中。我目前的问题是，当从服务器接收大量数据时，性能非常糟糕:传输数据和处理数据都需要时间。解决方案可能是让一个应用程序在服务器端进行处理，并只发送结果(这要小得多)。问题是，在发送响应之前，没有内置的函数来处理来自服务器的响应。我在考虑监听端口80上的所有流量，识别相关的HTTP响应，并在阻塞响应的同时将它们发送到我的应用程序(以避免发送大量不被客户端处理的数据量)。由于我缺乏大量的网络知识

浏览 0提问于2010-07-05得票数 0

回答已采纳

1回答

如何提高spring数据JPA性能

、、、、

我试图提高我的应用程序的性能，其中一个操作是从CSV文件中读取数据，并将每行的值存储为一个POJO (所以1500个CSV行=1500POJO)在PostgresSQL数据库中。它是一个spring引导应用程序，并使用带有(默认配置)的JpaRepository作为持久化的方法。当循环读取CSV文件中的每一行时，我最初的尝试基本上是在循环的每一次迭代中使用这个语句： autowiredRepoInstance.save(objectInstance); 但是，使用spring.jpa.show-sql=true文件中的application.properties设置，我发现每个POJO都有一个

浏览 0提问于2018-07-02得票数 0

1回答

用置信区间绘制R中的平行坐标

、、

是否有允许用置信区间绘制平行坐标的R包？就像下面的例子。或者什么是最简单的选择？制作多个图形，并排打印或拼凑？生成的数据 library(tidyverse) set.seed(1) #make new data df = tibble( factor= c("A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L",

浏览 1提问于2020-11-16得票数 0

回答已采纳

1回答

类似于SQL表的循环调度，用于跟踪最近的活动

我们需要跟踪不同时间段的用户活动，如24小时，7天等。我们预计不会有很大数量的不同时期，但用户数量将非常大，可能在数百万。每晚cronjob汇总每个用户的统计数据听起来并不合理。我知道过去我曾用RRD表这样跟踪网络使用情况，但这些只是BerkeleyDB的，而且每个统计数据必须有一个文件，这是行不通的，但这个想法似乎是我想要的。有没有我忽略的模式/最佳实践？

浏览 1提问于2011-12-31得票数 2

回答已采纳

1回答

我的MongoDB需要Hadoop吗？

、、

我对MongoDB的用法非常简单。我只有一个副本集，并且在不使用Map Reduce的情况下处理一些基本查询。我听说Hadoop是一个很棒的数据处理工具，一旦MongoDB连接到，它就可以提高性能。它能很好地处理Map Reduce，但它对我这个不包含任何Map Reduce函数的例子有用吗？此外，如果我在MongoDB中使用Map Reduce并连接Hadoop，性能将如何提高？

浏览 0提问于2014-04-25得票数 0

1回答

图形数据库功能

、、、

最近我开始了解图形数据库，我读到这些数据库的分析能力有限。我在这里读到“在这种类型的数据库平台上，跟踪使用模式和提供基于用户历史的建议可能在最好的情况下是困难的，在最坏的情况下是不可能的。” 1我不能理解为什么这种分析在这里是有限的？ 2如何使用这些数据库图形进行归档，例如facebook，它保存了数百万用户的所有帖子。如何在图形数据库中做到这一点？

浏览 1提问于2011-03-27得票数 0

回答已采纳

1回答

外部存储:世界可读性和私有性？

、、

我对android外部storage感到困惑:它具有世界可读性，但同时也可以在上面保存应用程序私有文件？这不是冲突吗？本页面介绍了Android上的不同数据存储选项:1-内部文件存储:在设备文件系统上存储应用程序-私有文件。2-外部文件存储:在共享的外部文件系统上存储文件。这通常用于共享用户文件，如照片。共享首选项:将私有原始数据存储在键值对中。数据库:将结构化数据存储在私有数据库中。除了外部存储中的某些类型的文件之外，所有这些选项都是针对应用程序私有数据的--其他应用程序自然无法访问这些数据。最后一行表示，保存在所有这些选项上的大多数文件都是应用程序--除了外部存储中的某些类型

浏览 4提问于2018-09-09得票数 0

1回答

我是否应该在有3个或更多传感器的项目中使用Raspberry Pi或Arduino？

、、

我最近开始了一个项目，我们正在尝试建造一个带有不同感应器的盒子。因为我对此相当陌生，所以我想知道我应该为这个项目购买哪些硬件。做完我的研究之后，我还是不确定该买哪一个. 对于这个项目，我想连接到董事会： 1 IMU (我们已经有来自博世的BMI085 )2红外传感器(我在看来自夏普的GP2Y0A60SZLF )1相机从我所读到的来看，Arduino似乎更容易被新程序员使用，但是我似乎对Raspberry Pi有更大的灵活性，并且更容易将相机连接到它。该项目的最终目标是从所有传感器实时收集数据，并将其保存在SD卡上。还应该有某种时间标准，以便能够将所有传感器的信息匹配到特定的时间。谢谢你的

浏览 0提问于2020-05-01得票数 0

回答已采纳

1回答

SQL全文搜索-设计决策:多个表还是一个巨大的表

、

我对SQL有些陌生，但我正在创建一个数据库，其中有一个电影元数据表，我需要对电影脚本进行全文搜索，这些电影脚本目前被组织成大型表，每个电影一个表，列有行号、时间戳和文本正文(需要能够搜索关键字和短语)。我的问题是，我的搜索速度是否会更快，用一个巨大的表来搜索所有的脚本，而不是每个电影都有一个表。我使用的是SQLite和Python。我正在使用fts4来实现全文搜索功能。

浏览 2提问于2015-05-27得票数 0

1回答

在WordPress数据库中添加超过15K的项而不会压倒服务器？

、、、、

我们已经使用GuzzleHTTP和其他托管在AWS服务器上的相关库创建了一个Crawler，它仅从一个站点就为我们提供了大约5,000个产品，我们总共有4个站点，因此项目的计数是围绕着15k+进行的。现在，Crawler运行得很好&我们可以在不到一个小时的时间内抓取所有的站点，并构建JSON文件。然后，我们将这些JSON文件中的数据导出到WordPress DB中，其中的项是post，任何附加数据都是post_meta、术语和分类法。我们现在正在使用WP Ajax挂钩和过滤器以及一个循环(当然)来完成这个任务。但是它需要大量的时间来导出，并且服务器超时的可能性很高，这将是正常情况

浏览 0提问于2018-11-21得票数 0

1回答

哪一个是在多个设备上处理海量数据的最佳数据网格？

、、、

哪个是最好的跨浏览器兼容的数据网格 of JavaScript，用于在多个设备(包括pc、移动、平板电脑)上进行海量数据处理，具有最佳的功能和未来的开发方法？我搜索了以下网格： D-网格(不提供分组和多语言支持) Grid-X (不提供分组和多语言支持) 用户界面网格 dhtmlx Telerik Kendo UI jQWidgets网格我正在寻找-至少以下功能：嵌套排序搜索/过滤UI 实时数据编辑/更新多语言支持行/科尔的拖放支持摘要行可重选、可排序和可隐藏的列支持将行分组为可折叠的部分。请推荐最好的。

浏览 3提问于2015-07-27得票数 0

2回答

视频元/标签编辑器

、、、

我正在为最常见的视频容器(包括mkv、mp4、wmv、avi和flv )寻找一个免费/免费的元数据/标记编辑器。对于Windows，我更喜欢命令行。我尝试了ffmpeg，但是它不支持完整的元数据编辑，它必须重新修改(重新构建)文件来更改标记/元数据。

浏览 0提问于2015-07-20得票数 3

2回答

SQL Server表转储-并非所有列

、、

我正在尝试对数据库(Microsoft SQL Server)中的几个表执行SQL Server转储。我们没有对数据库的写访问权限，所以我们不能做我最初想做的事情(创建temp DB，复制表(减去我们不想要的列到temp db中，然后转储该db)。我真的想不出办法来做这件事。 csv导出不起作用(几乎不可能将数据放在换行符的正确字段b/c中)。有什么建议吗？

浏览 4提问于2009-10-31得票数 0

1回答

ST-Link V2 -检测为USB大容量存储设备

、、

我有一个"STM32VLDISCOVERY“板()，我连接到我的Windows。该板有一个集成的“ST-链接V2”程序员/调试器，基于"STM32F103C8“的微控制器，实际上与PC通讯。但是这种微控制器被认为是一种"USB大容量存储设备“。在“设备管理器”中，它位于Disk drives/STM32下面。如果我右键单击它并遵循Properties/Driver/Driver Deatils/，就不会列出ST驱动程序。只有一些Windows默认驱动程序用于此设备：现在我切断了板子。如文档中所述，我们只需安装"ST-Link V2“Window

浏览 22提问于2022-03-30得票数 1

2回答

Magento -从Mage_Catalog_Model_Resource_Product_Collection对象访问值

、、、

我是magento和php的新手，我正在尝试从对象中检索值。 $_productCollection=$this->getLoadedProductCollection(); 当我执行print_r()时，我会得到如下所示的结果 Mage_Catalog_Model_Resource_Product_Collection Object ( [_flatEnabled:protected] => Array ( [1] => ) [_productWebsiteTable:protected] =>

浏览 2提问于2011-12-06得票数 0

2回答

以Usb主机模式将数据从android发送到连接的Usb存储设备

、、、

在我的应用程序中，使用的是USB主机模式，它提供了有关连接USB海量存储设备的信息，比如Usb Flash Drive，在我使用case.Now时，我需要在连接的闪存驱动器上创建一个文件，并在文件中保存一些数据。到目前为止，我发现连接到该设备的情况如下， MainActivity.java public class MainActivity extends AppCompatActivity { private static final String TAG = MainActivity.class.getSimpleName(); private Butto

浏览 2提问于2018-02-09得票数 3

回答已采纳

2回答

如何使用Jetpack库保存活动实例

、、

我需要存储大量的数据。比方说，当要旋转我的应用程序崩溃时，我需要存储用户列表和他们的头像。我如何存储数据有什么窍门吗？

浏览 13提问于2019-01-10得票数 0

回答已采纳

1回答

寻找能够处理海量数据的java.util.List实现

我正在尝试解决遗留系统的OOM问题。经过分析，我发现它可能会从数据库中查询大量数据，并将其存储在ArrayList中。但是因为大多数文档都丢失了，我们不能做太多的修改。所以我想寻找一个列表实现，它可以处理巨大的数据。例如:我可以将所有数据存储在一个文件中，并且只需在内存中保留1000个元素。如果迭代器或get()尝试访问不在内存中的数据，它可以自动从磁盘检索数据。谢谢你的建议！

浏览 1提问于2014-06-01得票数 0

2回答

存储和处理大数据量

、、

日安！我有350 80的非结构化数据，按50-80列分类。我需要将这些数据存储在NoSQL数据库中，并执行按40列过滤的各种选择和映射/还原查询。我想使用mongodb，所以我有一个确定的问题:这个数据库能够处理这个任务吗?在现有的提供者hetzner.de中，我需要什么来实现它的架构？

浏览 3提问于2012-01-16得票数 0

1回答

创建一个用于记录套接字通信的高效日志库

、、、

我想创建一个日志库，它将记录数据包发送和接收b/w多个客户端和服务器应用程序，我想创建这个库优化，以记录尽可能多的日志，但为了实现它，它必须克服IO绑定问题，我认为计时器将是好的，对于特定的时间量，我们无法记录，然后日志线程将被杀死，我们继续工作，没有日志，当我们再次收到它时，我们应该再次这样做。我想知道有没有比这更好的方法？或者有人可能会对此有一些看法？

浏览 0提问于2018-05-11得票数 0

3回答

访问web数据以在应用程序中使用？

我想写一个简单的iPhone应用程序来访问网络上的某种数据。我在想一些东西，比如洛杉矶的温度，温哥华的降雪量等等，基本上都是随着时间的推移而变化的。谁能给我任何关于目前的方式，你可以访问网络上的应用程序中使用的变量远程数据的任何指点。我是否应该寻找我可以查询的在线数据库，某种馈送，我只是不太确定你是如何去做的。任何例子或指针都将非常感谢。加里

浏览 0提问于2010-02-09得票数 0

回答已采纳