文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

如何标准化时间范围内数组的元素?

2024-02-08 21:31

关注

php小编新一为您介绍如何在时间范围内标准化数组的元素。在开发中,我们经常需要处理时间序列数据,而这些数据可能会出现时间跳跃或者缺失的情况。为了保证数据的准确性和完整性,我们需要对数组中的元素进行标准化。标准化可以使数组的元素按照时间顺序排列,并填充缺失的时间点。下面,我们将详细介绍如何实现这一功能。

问题内容

我正在尝试标准化一个时间范围内的元素数组。假设您有 20 笔银行交易发生在 2022 年 1 月 1 日

transaction  1 - 2022/01/01
transaction  2 - 2022/01/01
...
transaction 20 - 2022/01/01

除了它们发生的日期之外,我们没有其他数据,但我们仍然希望为它们分配一天中的一个小时,因此它们结束为:

transaction  1 - 2022/01/01 00:00
transaction  2 - 2022/01/01 ??:??
...
transaction 20 - 2022/01/01 23:59

在 go 中,我有一个函数尝试计算元素数组中索引的一天中某个时间的标准化:

func normal(start, end time.time, arraysize, index float64) time.time {
    delta := end.sub(start)
    minutes := delta.minutes()

    duration := minutes * ((index+1) / arraysize)

    return start.add(time.duration(duration) * time.minute)
}

但是,我在 2022/1/1 00:00 到 2022/1/1 23:59 的时间范围内意外计算出 4 个元素数组中索引 0 的 2022/1/1 05:59 ,相反,我希望看到 2022/1/1 00:00。在这些条件下唯一能正常工作的是索引 3。

那么,我的标准化做错了什么?

编辑:

这是由 @icza 修复的函数

func timeindex(min, max time.time, entries, position float64) time.time {
    delta := max.sub(min)
    minutes := delta.minutes()

    if position < 0 {
        position = 0
    }

    duration := (minutes * (position / (entries - 1)))

    return min.add(time.duration(duration) * time.minute)
}

有一个例子:假设我们的开始和结束日期是 2022/01/01 00:00 - 2022/01/01 00:03,我们的银行交易数组中有 3 个条目,我们希望获取第 3 号交易的标准化时间(数组中的 2):

result := timeindex(time.date(2022, time.january, 1, 0, 0, 0, 0, time.utc), time.date(2022, time.january, 1, 0, 3, 0, 0, time.utc), 3, 2)

由于开始时间和结束时间之间只有 4 分钟(从 00:0000:03),并且想要查找数组(大小 3)中最后一个条目(索引 2)的标准化时间,结果应该是:

fmt.Printf("%t", result.Equal(time.Date(2022, time.January, 1, 0, 3, 0, 0, time.UTC))
// prints "true"

或范围内的最后一分钟,即 00:03

这是一个可重现的示例:https://go.dev/play/p/ezwkqanv1at

解决方法

n 点之间有 n-1 段。这意味着,如果您想在插值中包含 startend,则时间段数(即 delta)为 arraysize - 1

此外,如果将 1 添加到 index,则结果不可能是 start (您将跳过 00:00)。

所以正确的算法是这样的:

func normal(start, end time.time, arraysize, index float64) time.time {
    minutes := end.sub(start).minutes()

    duration := minutes * (index / (arraysize - 1))

    return start.add(time.duration(duration) * time.minute)
}

在 go playground 上尝试一下。

另请注意,如果您有很多交易(按照一天中的分钟数排列,大约一千次),您可能很容易最终会出现多个具有相同时间戳(相同小时和分钟)的交易。如果您想避免这种情况,请使用比分钟更小的精度,例如秒或毫秒:

func normal(start, end time.time, arraysize, index float64) time.time {
    sec := end.sub(start).seconds()

    duration := sec * (index / (arraysize - 1))

    return start.add(time.duration(duration) * time.second)
}

是的,这将导致时间戳的秒数也不一定为零,但将确保更高的交易数量具有不同的、唯一的时间戳。

如果您的交易数量级接近一天的秒数(即 86400),那么您可以完全删除此“单位”并使用 time.duration 本身(即纳秒)。即使对于最大数量的事务,这也将保证时间戳的唯一性:

func normal(start, end time.time, arraysize, index float64) time.time {
    delta := float64(end.sub(start))

    duration := delta * (index / (arraysize - 1))

    return start.add(time.duration(duration))
}

用 100 万笔交易对此进行测试,以下是前 15 个时间部分(它们仅在亚秒部分延迟):

0 - 00:00:00.00000
1 - 00:00:00.08634
2 - 00:00:00.17268
3 - 00:00:00.25902
4 - 00:00:00.34536
5 - 00:00:00.43170
6 - 00:00:00.51804
7 - 00:00:00.60438
8 - 00:00:00.69072
9 - 00:00:00.77706
10 - 00:00:00.86340
11 - 00:00:00.94974
12 - 00:00:01.03608
13 - 00:00:01.12242
14 - 00:00:01.20876
15 - 00:00:01.29510
16 - 00:00:01.38144
17 - 00:00:01.46778
18 - 00:00:01.55412
19 - 00:00:01.64046

在 go playground 上尝试一下这个。

以上就是如何标准化时间范围内数组的元素?的详细内容,更多请关注编程网其它相关文章!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯