0000: 2f 2a 0a 2a 2a 20 43 6f 70 79 72 69 67 68 74 20 /*.** Copyright
0010: 28 63 29 20 32 30 30 36 20 44 2e 20 52 69 63 68 (c) 2006 D. Rich
0020: 61 72 64 20 48 69 70 70 0a 2a 2a 0a 2a 2a 20 54 ard Hipp.**.** T
0030: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 66 his program is f
0040: 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 6f ree software; yo
0050: 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 75 u can redistribu
0060: 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 2a 2a 20 te it and/or.**
0070: 6d 6f 64 69 66 79 20 69 74 20 75 6e 64 65 72 20 modify it under
0080: 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65 the terms of the
0090: 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 75 62 GNU General Pub
00a0: 6c 69 63 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 76 lic.** License v
00b0: 65 72 73 69 6f 6e 20 32 20 61 73 20 70 75 62 6c ersion 2 as publ
00c0: 69 73 68 65 64 20 62 79 20 74 68 65 20 46 72 65 ished by the Fre
00d0: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
00e0: 61 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 ation..**.** Thi
00f0: 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 69 73 s program is dis
0100: 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 65 20 tributed in the
0110: 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 69 6c hope that it wil
0120: 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 2a 2a 20 l be useful,.**
0130: 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e 59 20 but WITHOUT ANY
0140: 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 6f 75 WARRANTY; withou
0150: 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c 69 t even the impli
0160: 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a 2a ed warranty of.*
0170: 2a 20 4d 45 52 43 48 41 4e 54 41 42 49 4c 49 54 * MERCHANTABILIT
0180: 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 4f 52 Y or FITNESS FOR
0190: 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 50 55 A PARTICULAR PU
01a0: 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 65 20 RPOSE. See the
01b0: 47 4e 55 0a 2a 2a 20 47 65 6e 65 72 61 6c 20 50 GNU.** General P
01c0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 66 6f ublic License fo
01d0: 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 2e 0a r more details..
01e0: 2a 2a 20 0a 2a 2a 20 59 6f 75 20 73 68 6f 75 6c ** .** You shoul
01f0: 64 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 d have received
0200: 61 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e a copy of the GN
0210: 55 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 U General Public
0220: 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 61 6c 6f 6e .** License alon
0230: 67 20 77 69 74 68 20 74 68 69 73 20 6c 69 62 72 g with this libr
0240: 61 72 79 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 ary; if not, wri
0250: 74 65 20 74 6f 20 74 68 65 0a 2a 2a 20 46 72 65 te to the.** Fre
0260: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
0270: 61 74 69 6f 6e 2c 20 49 6e 63 2e 2c 20 35 39 20 ation, Inc., 59
0280: 54 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53 Temple Place - S
0290: 75 69 74 65 20 33 33 30 2c 0a 2a 2a 20 42 6f 73 uite 330,.** Bos
02a0: 74 6f 6e 2c 20 4d 41 20 20 30 32 31 31 31 2d 31 ton, MA 02111-1
02b0: 33 30 37 2c 20 55 53 41 2e 0a 2a 2a 0a 2a 2a 20 307, USA..**.**
02c0: 41 75 74 68 6f 72 20 63 6f 6e 74 61 63 74 20 69 Author contact i
02d0: 6e 66 6f 72 6d 61 74 69 6f 6e 3a 0a 2a 2a 20 20 nformation:.**
02e0: 20 64 72 68 40 68 77 61 63 69 2e 63 6f 6d 0a 2a drh@hwaci.com.*
02f0: 2a 20 20 20 68 74 74 70 3a 2f 2f 77 77 77 2e 68 * http://www.h
0300: 77 61 63 69 2e 63 6f 6d 2f 64 72 68 2f 0a 2a 2a waci.com/drh/.**
0310: 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a .***************
0320: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0330: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0340: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0350: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0360: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 6d 6f 64 75 .**.** This modu
0370: 6c 65 20 69 6d 70 6c 65 6d 65 6e 74 73 20 74 68 le implements th
0380: 65 20 64 65 6c 74 61 20 63 6f 6d 70 72 65 73 73 e delta compress
0390: 20 61 6c 67 6f 72 69 74 68 6d 2e 0a 2a 2a 0a 2a algorithm..**.*
03a0: 2a 20 54 68 6f 75 67 68 20 64 65 76 65 6c 6f 70 * Though develop
03b0: 65 64 20 73 70 65 63 69 66 69 63 61 6c 6c 79 20 ed specifically
03c0: 66 6f 72 20 66 6f 73 73 69 6c 2c 20 74 68 65 20 for fossil, the
03d0: 63 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c code in this fil
03e0: 65 0a 2a 2a 20 69 73 20 67 65 6e 65 72 61 6c 6c e.** is generall
03f0: 79 20 61 70 70 6c 69 61 62 6c 65 20 61 6e 64 20 y appliable and
0400: 69 73 20 74 68 75 73 20 65 61 73 69 6c 79 20 73 is thus easily s
0410: 65 70 61 72 61 74 65 64 20 66 72 6f 6d 20 74 68 eparated from th
0420: 65 0a 2a 2a 20 66 6f 73 73 69 6c 20 73 6f 75 72 e.** fossil sour
0430: 63 65 20 63 6f 64 65 20 62 61 73 65 2e 20 20 4e ce code base. N
0440: 6f 74 68 69 6e 67 20 69 6e 20 74 68 69 73 20 66 othing in this f
0450: 69 6c 65 20 64 65 70 65 6e 64 73 20 6f 6e 20 61 ile depends on a
0460: 6e 79 74 68 69 6e 67 0a 2a 2a 20 65 6c 73 65 20 nything.** else
0470: 69 6e 20 66 6f 73 73 69 6c 2e 0a 2a 2f 0a 23 69 in fossil..*/.#i
0480: 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68 3e nclude <stdio.h>
0490: 0a 23 69 6e 63 6c 75 64 65 20 3c 61 73 73 65 72 .#include <asser
04a0: 74 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 t.h>.#include <s
04b0: 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64 tdlib.h>.#includ
04c0: 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a e <string.h>../*
04d0: 0a 2a 2a 20 4d 61 63 72 6f 73 20 66 6f 72 20 74 .** Macros for t
04e0: 75 72 6e 69 6e 67 20 64 65 62 75 67 67 69 6e 67 urning debugging
04f0: 20 70 72 69 6e 74 66 73 20 6f 6e 20 61 6e 64 20 printfs on and
0500: 6f 66 66 0a 2a 2f 0a 23 69 66 20 30 0a 23 20 64 off.*/.#if 0.# d
0510: 65 66 69 6e 65 20 44 45 42 55 47 31 28 58 29 20 efine DEBUG1(X)
0520: 58 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 6e 65 X.#else.# define
0530: 20 44 45 42 55 47 31 28 58 29 0a 23 65 6e 64 69 DEBUG1(X).#endi
0540: 66 0a 23 69 66 20 30 0a 23 64 65 66 69 6e 65 20 f.#if 0.#define
0550: 44 45 42 55 47 32 28 58 29 20 58 0a 2f 2a 0a 2a DEBUG2(X) X./*.*
0560: 2a 20 46 6f 72 20 64 65 62 75 67 67 69 6e 67 3a * For debugging:
0570: 0a 2a 2a 20 50 72 69 6e 74 20 31 36 20 63 68 61 .** Print 16 cha
0580: 72 61 63 74 65 72 73 20 6f 66 20 74 65 78 74 20 racters of text
0590: 66 72 6f 6d 20 7a 42 75 66 0a 2a 2f 0a 73 74 61 from zBuf.*/.sta
05a0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a tic const char *
05b0: 70 72 69 6e 74 31 36 28 63 6f 6e 73 74 20 63 68 print16(const ch
05c0: 61 72 20 2a 7a 29 7b 0a 20 20 69 6e 74 20 69 3b ar *z){. int i;
05d0: 0a 20 20 73 74 61 74 69 63 20 63 68 61 72 20 7a . static char z
05e0: 42 75 66 5b 32 30 5d 3b 0a 20 20 66 6f 72 28 69 Buf[20];. for(i
05f0: 3d 30 3b 20 69 3c 31 36 3b 20 69 2b 2b 29 7b 0a =0; i<16; i++){.
0600: 20 20 20 20 69 66 28 20 7a 5b 69 5d 3e 3d 30 78 if( z[i]>=0x
0610: 32 30 20 26 26 20 7a 5b 69 5d 3c 3d 30 78 37 65 20 && z[i]<=0x7e
0620: 20 29 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b 69 ){. zBuf[i
0630: 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 7d 65 ] = z[i];. }e
0640: 6c 73 65 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b lse{. zBuf[
0650: 69 5d 20 3d 20 27 2e 27 3b 0a 20 20 20 20 7d 0a i] = '.';. }.
0660: 20 20 7d 0a 20 20 7a 42 75 66 5b 69 5d 20 3d 20 }. zBuf[i] =
0670: 30 3b 0a 20 20 72 65 74 75 72 6e 20 7a 42 75 66 0;. return zBuf
0680: 3b 0a 7d 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 ;.}.#else.# defi
0690: 6e 65 20 44 45 42 55 47 32 28 58 29 0a 23 65 6e ne DEBUG2(X).#en
06a0: 64 69 66 0a 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 dif.../*.** The
06b0: 22 75 33 32 22 20 74 79 70 65 20 6d 75 73 74 20 "u32" type must
06c0: 62 65 20 61 6e 20 75 6e 73 69 67 6e 65 64 20 33 be an unsigned 3
06d0: 32 2d 62 69 74 20 69 6e 74 65 67 65 72 2e 20 20 2-bit integer.
06e0: 41 64 6a 75 73 74 20 74 68 69 73 0a 2a 2f 0a 74 Adjust this.*/.t
06f0: 79 70 65 64 65 66 20 75 6e 73 69 67 6e 65 64 20 ypedef unsigned
0700: 69 6e 74 20 75 33 32 3b 0a 0a 2f 2a 0a 2a 2a 20 int u32;../*.**
0710: 4d 75 73 74 20 62 65 20 61 20 31 36 2d 62 69 74 Must be a 16-bit
0720: 20 76 61 6c 75 65 20 0a 2a 2f 0a 74 79 70 65 64 value .*/.typed
0730: 65 66 20 73 68 6f 72 74 20 69 6e 74 20 73 31 36 ef short int s16
0740: 3b 0a 74 79 70 65 64 65 66 20 75 6e 73 69 67 6e ;.typedef unsign
0750: 65 64 20 73 68 6f 72 74 20 69 6e 74 20 75 31 36 ed short int u16
0760: 3b 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 77 69 64 ;../*.** The wid
0770: 74 68 20 6f 66 20 61 20 68 61 73 68 20 77 69 6e th of a hash win
0780: 64 6f 77 20 69 6e 20 62 79 74 65 73 2e 20 20 54 dow in bytes. T
0790: 68 65 20 61 6c 67 6f 72 69 74 68 6d 20 6f 6e 6c he algorithm onl
07a0: 79 20 77 6f 72 6b 73 20 69 66 20 74 68 69 73 0a y works if this.
07b0: 2a 2a 20 69 73 20 61 20 70 6f 77 65 72 20 6f 66 ** is a power of
07c0: 20 32 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4e 2..*/.#define N
07d0: 48 41 53 48 20 31 36 0a 0a 2f 2a 0a 2a 2a 20 54 HASH 16../*.** T
07e0: 68 65 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 he current state
07f0: 20 6f 66 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 of the rolling
0800: 68 61 73 68 2e 0a 2a 2a 0a 2a 2a 20 7a 5b 5d 20 hash..**.** z[]
0810: 68 6f 6c 64 73 20 74 68 65 20 76 61 6c 75 65 73 holds the values
0820: 20 74 68 61 74 20 68 61 76 65 20 62 65 65 6e 20 that have been
0830: 68 61 73 68 65 64 2e 20 20 7a 5b 5d 20 69 73 20 hashed. z[] is
0840: 61 20 63 69 72 63 75 6c 61 72 20 62 75 66 66 65 a circular buffe
0850: 72 2e 0a 2a 2a 20 7a 5b 69 5d 20 69 73 20 74 68 r..** z[i] is th
0860: 65 20 66 69 72 73 74 20 65 6e 74 72 79 20 61 6e e first entry an
0870: 64 20 7a 5b 28 69 2b 4e 48 41 53 48 2d 31 29 25 d z[(i+NHASH-1)%
0880: 4e 48 41 53 48 5d 20 69 73 20 74 68 65 20 6c 61 NHASH] is the la
0890: 73 74 20 65 6e 74 72 79 20 6f 66 20 0a 2a 2a 20 st entry of .**
08a0: 74 68 65 20 77 69 6e 64 6f 77 2e 0a 2a 2a 0a 2a the window..**.*
08b0: 2a 20 48 61 73 68 2e 61 20 69 73 20 74 68 65 20 * Hash.a is the
08c0: 73 75 6d 20 6f 66 20 61 6c 6c 20 65 6c 65 6d 65 sum of all eleme
08d0: 6e 74 73 20 6f 66 20 68 61 73 68 2e 7a 5b 5d 2e nts of hash.z[].
08e0: 20 20 48 61 73 68 2e 62 20 69 73 20 61 20 77 65 Hash.b is a we
08f0: 69 67 68 74 65 64 0a 2a 2a 20 73 75 6d 2e 20 20 ighted.** sum.
0900: 48 61 73 68 2e 62 20 69 73 20 7a 5b 69 5d 2a 4e Hash.b is z[i]*N
0910: 48 41 53 48 20 2b 20 7a 5b 69 2b 31 5d 2a 28 4e HASH + z[i+1]*(N
0920: 48 41 53 48 2d 31 29 20 2b 20 2e 2e 2e 20 2b 20 HASH-1) + ... +
0930: 7a 5b 69 2b 4e 48 41 53 48 2d 31 5d 2a 31 2e 0a z[i+NHASH-1]*1..
0940: 2a 2a 20 28 45 61 63 68 20 69 6e 64 65 78 20 66 ** (Each index f
0950: 6f 72 20 7a 5b 5d 20 73 68 6f 75 6c 64 20 62 65 or z[] should be
0960: 20 6d 6f 64 75 6c 65 20 4e 48 41 53 48 2c 20 6f module NHASH, o
0970: 66 20 63 6f 75 72 73 65 2e 20 20 54 68 65 20 25 f course. The %
0980: 4e 48 41 53 48 20 6f 70 65 72 61 74 6f 72 0a 2a NHASH operator.*
0990: 2a 20 69 73 20 6f 6d 69 74 74 65 64 20 69 6e 20 * is omitted in
09a0: 74 68 65 20 70 72 69 6f 72 20 65 78 70 72 65 73 the prior expres
09b0: 73 69 6f 6e 20 66 6f 72 20 62 72 65 76 69 74 79 sion for brevity
09c0: 2e 29 0a 2a 2f 0a 74 79 70 65 64 65 66 20 73 74 .).*/.typedef st
09d0: 72 75 63 74 20 68 61 73 68 20 68 61 73 68 3b 0a ruct hash hash;.
09e0: 73 74 72 75 63 74 20 68 61 73 68 20 7b 0a 20 20 struct hash {.
09f0: 75 31 36 20 61 2c 20 62 3b 20 20 20 20 20 20 20 u16 a, b;
0a00: 20 20 2f 2a 20 48 61 73 68 20 76 61 6c 75 65 73 /* Hash values
0a10: 20 2a 2f 0a 20 20 75 31 36 20 69 3b 20 20 20 20 */. u16 i;
0a20: 20 20 20 20 20 20 20 20 2f 2a 20 53 74 61 72 74 /* Start
0a30: 20 6f 66 20 74 68 65 20 68 61 73 68 20 77 69 6e of the hash win
0a40: 64 6f 77 20 2a 2f 0a 20 20 63 68 61 72 20 7a 5b dow */. char z[
0a50: 4e 48 41 53 48 5d 3b 20 20 20 20 2f 2a 20 54 68 NHASH]; /* Th
0a60: 65 20 76 61 6c 75 65 73 20 74 68 61 74 20 68 61 e values that ha
0a70: 76 65 20 62 65 65 6e 20 68 61 73 68 65 64 20 2a ve been hashed *
0a80: 2f 0a 7d 3b 0a 0a 2f 2a 0a 2a 2a 20 49 6e 69 74 /.};../*.** Init
0a90: 69 61 6c 69 7a 65 20 74 68 65 20 72 6f 6c 6c 69 ialize the rolli
0aa0: 6e 67 20 68 61 73 68 20 75 73 69 6e 67 20 74 68 ng hash using th
0ab0: 65 20 66 69 72 73 74 20 4e 48 41 53 48 20 63 68 e first NHASH ch
0ac0: 61 72 61 63 74 65 72 73 20 6f 66 20 7a 5b 5d 0a aracters of z[].
0ad0: 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 */.static void h
0ae0: 61 73 68 5f 69 6e 69 74 28 68 61 73 68 20 2a 70 ash_init(hash *p
0af0: 48 61 73 68 2c 20 63 6f 6e 73 74 20 63 68 61 72 Hash, const char
0b00: 20 2a 7a 29 7b 0a 20 20 75 31 36 20 61 2c 20 62 *z){. u16 a, b
0b10: 2c 20 69 3b 0a 20 20 61 20 3d 20 62 20 3d 20 30 , i;. a = b = 0
0b20: 3b 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 4e ;. for(i=0; i<N
0b30: 48 41 53 48 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 HASH; i++){.
0b40: 61 20 2b 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 62 a += z[i];. b
0b50: 20 2b 3d 20 28 4e 48 41 53 48 2d 69 29 2a 7a 5b += (NHASH-i)*z[
0b60: 69 5d 3b 0a 20 20 20 20 70 48 61 73 68 2d 3e 7a i];. pHash->z
0b70: 5b 69 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 7d 0a [i] = z[i];. }.
0b80: 20 20 70 48 61 73 68 2d 3e 61 20 3d 20 61 20 26 pHash->a = a &
0b90: 20 30 78 66 66 66 66 3b 0a 20 20 70 48 61 73 68 0xffff;. pHash
0ba0: 2d 3e 62 20 3d 20 62 20 26 20 30 78 66 66 66 66 ->b = b & 0xffff
0bb0: 3b 0a 20 20 70 48 61 73 68 2d 3e 69 20 3d 20 30 ;. pHash->i = 0
0bc0: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 41 64 76 61 6e ;.}../*.** Advan
0bd0: 63 65 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 68 ce the rolling h
0be0: 61 73 68 20 62 79 20 61 20 73 69 6e 67 6c 65 20 ash by a single
0bf0: 63 68 61 72 61 63 74 65 72 20 22 63 22 0a 2a 2f character "c".*/
0c00: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 61 73 .static void has
0c10: 68 5f 6e 65 78 74 28 68 61 73 68 20 2a 70 48 61 h_next(hash *pHa
0c20: 73 68 2c 20 69 6e 74 20 63 29 7b 0a 20 20 75 31 sh, int c){. u1
0c30: 36 20 6f 6c 64 20 3d 20 70 48 61 73 68 2d 3e 7a 6 old = pHash->z
0c40: 5b 70 48 61 73 68 2d 3e 69 5d 3b 0a 20 20 70 48 [pHash->i];. pH
0c50: 61 73 68 2d 3e 7a 5b 70 48 61 73 68 2d 3e 69 5d ash->z[pHash->i]
0c60: 20 3d 20 63 3b 0a 20 20 70 48 61 73 68 2d 3e 69 = c;. pHash->i
0c70: 20 3d 20 28 70 48 61 73 68 2d 3e 69 2b 31 29 26 = (pHash->i+1)&
0c80: 28 4e 48 41 53 48 2d 31 29 3b 0a 20 20 70 48 61 (NHASH-1);. pHa
0c90: 73 68 2d 3e 61 20 3d 20 70 48 61 73 68 2d 3e 61 sh->a = pHash->a
0ca0: 20 2d 20 6f 6c 64 20 2b 20 63 3b 0a 20 20 70 48 - old + c;. pH
0cb0: 61 73 68 2d 3e 62 20 3d 20 70 48 61 73 68 2d 3e ash->b = pHash->
0cc0: 62 20 2d 20 4e 48 41 53 48 2a 6f 6c 64 20 2b 20 b - NHASH*old +
0cd0: 70 48 61 73 68 2d 3e 61 3b 0a 7d 0a 0a 2f 2a 0a pHash->a;.}../*.
0ce0: 2a 2a 20 52 65 74 75 72 6e 20 61 20 33 32 2d 62 ** Return a 32-b
0cf0: 69 74 20 68 61 73 68 20 76 61 6c 75 65 0a 2a 2f it hash value.*/
0d00: 0a 73 74 61 74 69 63 20 75 33 32 20 68 61 73 68 .static u32 hash
0d10: 5f 33 32 62 69 74 28 68 61 73 68 20 2a 70 48 61 _32bit(hash *pHa
0d20: 73 68 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 70 sh){. return (p
0d30: 48 61 73 68 2d 3e 61 20 26 20 30 78 66 66 66 66 Hash->a & 0xffff
0d40: 29 20 7c 20 28 28 28 75 33 32 29 28 70 48 61 73 ) | (((u32)(pHas
0d50: 68 2d 3e 62 20 26 20 30 78 66 66 66 66 29 29 3c h->b & 0xffff))<
0d60: 3c 31 36 29 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 57 <16);.}../*.** W
0d70: 72 69 74 65 20 61 6e 20 62 61 73 65 2d 36 34 20 rite an base-64
0d80: 69 6e 74 65 67 65 72 20 69 6e 74 6f 20 74 68 65 integer into the
0d90: 20 67 69 76 65 6e 20 62 75 66 66 65 72 2e 0a 2a given buffer..*
0da0: 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 70 75 /.static void pu
0db0: 74 49 6e 74 28 75 6e 73 69 67 6e 65 64 20 69 6e tInt(unsigned in
0dc0: 74 20 76 2c 20 63 68 61 72 20 2a 2a 70 7a 29 7b t v, char **pz){
0dd0: 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 . static const
0de0: 63 68 61 72 20 7a 44 69 67 69 74 73 5b 5d 20 3d char zDigits[] =
0df0: 20 0a 20 20 20 20 22 30 31 32 33 34 35 36 37 38 . "012345678
0e00: 39 41 42 43 44 45 46 47 48 49 4a 4b 4c 4d 4e 4f 9ABCDEFGHIJKLMNO
0e10: 50 51 52 53 54 55 56 57 58 59 5a 5f 61 62 63 64 PQRSTUVWXYZ_abcd
0e20: 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 71 72 73 74 efghijklmnopqrst
0e30: 75 76 77 78 79 7a 7e 22 3b 0a 20 20 2f 2a 20 20 uvwxyz~";. /*
0e40: 31 32 33 34 35 36 37 38 39 20 31 32 33 34 35 36 123456789 123456
0e50: 37 38 39 20 31 32 33 34 35 36 37 38 39 20 31 32 789 123456789 12
0e60: 33 34 35 36 37 38 39 20 31 32 33 34 35 36 37 38 3456789 12345678
0e70: 39 20 31 32 33 34 35 36 37 38 39 20 31 32 33 20 9 123456789 123
0e80: 2a 2f 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 20 */. int i, j;.
0e90: 20 63 68 61 72 20 7a 42 75 66 5b 32 30 5d 3b 0a char zBuf[20];.
0ea0: 20 20 69 66 28 20 76 3d 3d 30 20 29 7b 0a 20 20 if( v==0 ){.
0eb0: 20 20 2a 28 2a 70 7a 29 2b 2b 20 3d 20 27 30 27 *(*pz)++ = '0'
0ec0: 3b 0a 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 ;. return;.
0ed0: 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 76 3e 30 }. for(i=0; v>0
0ee0: 3b 20 69 2b 2b 2c 20 76 3e 3e 3d 36 29 7b 0a 20 ; i++, v>>=6){.
0ef0: 20 20 20 7a 42 75 66 5b 69 5d 20 3d 20 7a 44 69 zBuf[i] = zDi
0f00: 67 69 74 73 5b 76 26 30 78 33 66 5d 3b 0a 20 20 gits[v&0x3f];.
0f10: 7d 0a 20 20 66 6f 72 28 6a 3d 69 2d 31 3b 20 6a }. for(j=i-1; j
0f20: 3e 3d 30 3b 20 6a 2d 2d 29 7b 0a 20 20 20 20 2a >=0; j--){. *
0f30: 28 2a 70 7a 29 2b 2b 20 3d 20 7a 42 75 66 5b 6a (*pz)++ = zBuf[j
0f40: 5d 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 ];. }.}../*.**
0f50: 52 65 61 64 20 62 79 74 65 73 20 66 72 6f 6d 20 Read bytes from
0f60: 2a 70 7a 20 61 6e 64 20 63 6f 6e 76 65 72 74 20 *pz and convert
0f70: 74 68 65 6d 20 69 6e 74 6f 20 61 20 70 6f 73 69 them into a posi
0f80: 74 69 76 65 20 69 6e 74 65 67 65 72 2e 20 20 57 tive integer. W
0f90: 68 65 6e 0a 2a 2a 20 66 69 6e 69 73 68 65 64 2c hen.** finished,
0fa0: 20 6c 65 61 76 65 20 2a 70 7a 20 70 6f 69 6e 74 leave *pz point
0fb0: 69 6e 67 20 74 6f 20 74 68 65 20 66 69 72 73 74 ing to the first
0fc0: 20 63 68 61 72 61 63 74 65 72 20 70 61 73 74 20 character past
0fd0: 74 68 65 20 65 6e 64 20 6f 66 0a 2a 2a 20 74 68 the end of.** th
0fe0: 65 20 69 6e 74 65 67 65 72 2e 20 20 54 68 65 20 e integer. The
0ff0: 2a 70 4c 65 6e 20 70 61 72 61 6d 65 74 65 72 20 *pLen parameter
1000: 68 6f 6c 64 73 20 74 68 65 20 6c 65 6e 67 74 68 holds the length
1010: 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a of the string.*
1020: 2a 20 69 6e 20 2a 70 7a 20 61 6e 64 20 69 73 20 * in *pz and is
1030: 64 65 63 72 65 6d 65 6e 74 65 64 20 6f 6e 63 65 decremented once
1040: 20 66 6f 72 20 65 61 63 68 20 63 68 61 72 61 63 for each charac
1050: 74 65 72 20 69 6e 20 74 68 65 20 69 6e 74 65 67 ter in the integ
1060: 65 72 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e er..*/.static un
1070: 73 69 67 6e 65 64 20 69 6e 74 20 67 65 74 49 6e signed int getIn
1080: 74 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 2a 70 t(const char **p
1090: 7a 2c 20 69 6e 74 20 2a 70 4c 65 6e 29 7b 0a 20 z, int *pLen){.
10a0: 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 73 69 static const si
10b0: 67 6e 65 64 20 63 68 61 72 20 7a 56 61 6c 75 65 gned char zValue
10c0: 5b 5d 20 3d 20 7b 0a 20 20 20 20 2d 31 2c 20 2d [] = {. -1, -
10d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
10e0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 1, -1, -1, -1,
10f0: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1100: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 -1, -1, -1,.
1110: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1120: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1130: 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d -1, -1, -1, -
1140: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1150: 31 2c 0a 20 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 1,. -1, -1, -
1160: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1170: 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 20 2d 31 2c 1, -1, -1, -1,
1180: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1190: 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 20 20 30 2c -1, -1,. 0,
11a0: 20 20 31 2c 20 20 32 2c 20 20 33 2c 20 20 34 2c 1, 2, 3, 4,
11b0: 20 20 35 2c 20 20 36 2c 20 20 37 2c 20 20 20 20 5, 6, 7,
11c0: 38 2c 20 20 39 2c 20 2d 31 2c 20 2d 31 2c 20 2d 8, 9, -1, -1, -
11d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 1, -1, -1, -1,.
11e0: 20 20 20 2d 31 2c 20 31 30 2c 20 31 31 2c 20 31 -1, 10, 11, 1
11f0: 32 2c 20 31 33 2c 20 31 34 2c 20 31 35 2c 20 31 2, 13, 14, 15, 1
1200: 36 2c 20 20 20 31 37 2c 20 31 38 2c 20 31 39 2c 6, 17, 18, 19,
1210: 20 32 30 2c 20 32 31 2c 20 32 32 2c 20 32 33 2c 20, 21, 22, 23,
1220: 20 32 34 2c 0a 20 20 20 20 32 35 2c 20 32 36 2c 24,. 25, 26,
1230: 20 32 37 2c 20 32 38 2c 20 32 39 2c 20 33 30 2c 27, 28, 29, 30,
1240: 20 33 31 2c 20 33 32 2c 20 20 20 33 33 2c 20 33 31, 32, 33, 3
1250: 34 2c 20 33 35 2c 20 2d 31 2c 20 2d 31 2c 20 2d 4, 35, -1, -1, -
1260: 31 2c 20 2d 31 2c 20 33 36 2c 0a 20 20 20 20 2d 1, -1, 36,. -
1270: 31 2c 20 33 37 2c 20 33 38 2c 20 33 39 2c 20 34 1, 37, 38, 39, 4
1280: 30 2c 20 34 31 2c 20 34 32 2c 20 34 33 2c 20 20 0, 41, 42, 43,
1290: 20 34 34 2c 20 34 35 2c 20 34 36 2c 20 34 37 2c 44, 45, 46, 47,
12a0: 20 34 38 2c 20 34 39 2c 20 35 30 2c 20 35 31 2c 48, 49, 50, 51,
12b0: 0a 20 20 20 20 35 32 2c 20 35 33 2c 20 35 34 2c . 52, 53, 54,
12c0: 20 35 35 2c 20 35 36 2c 20 35 37 2c 20 35 38 2c 55, 56, 57, 58,
12d0: 20 35 39 2c 20 20 20 36 30 2c 20 36 31 2c 20 36 59, 60, 61, 6
12e0: 32 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 36 2, -1, -1, -1, 6
12f0: 33 2c 20 2d 31 2c 0a 20 20 7d 3b 0a 20 20 75 6e 3, -1,. };. un
1300: 73 69 67 6e 65 64 20 69 6e 74 20 76 20 3d 20 30 signed int v = 0
1310: 3b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 75 6e 73 ;. int c;. uns
1320: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d 20 igned char *z =
1330: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29 (unsigned char*)
1340: 2a 70 7a 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 *pz;. unsigned
1350: 63 68 61 72 20 2a 7a 53 74 61 72 74 20 3d 20 7a char *zStart = z
1360: 3b 0a 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20 ;. while( (c =
1370: 7a 56 61 6c 75 65 5b 30 78 37 66 26 2a 28 7a 2b zValue[0x7f&*(z+
1380: 2b 29 5d 29 3e 3d 30 20 29 7b 0a 20 20 20 20 20 +)])>=0 ){.
1390: 76 20 3d 20 28 76 3c 3c 36 29 20 2b 20 63 3b 0a v = (v<<6) + c;.
13a0: 20 20 7d 0a 20 20 7a 2d 2d 3b 0a 20 20 2a 70 4c }. z--;. *pL
13b0: 65 6e 20 2d 3d 20 7a 20 2d 20 7a 53 74 61 72 74 en -= z - zStart
13c0: 3b 0a 20 20 2a 70 7a 20 3d 20 28 63 68 61 72 2a ;. *pz = (char*
13d0: 29 7a 3b 0a 20 20 72 65 74 75 72 6e 20 76 3b 0a )z;. return v;.
13e0: 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 75 72 6e 20 }../*.** Return
13f0: 74 68 65 20 6e 75 6d 62 65 72 20 64 69 67 69 74 the number digit
1400: 73 20 69 6e 20 74 68 65 20 62 61 73 65 2d 36 34 s in the base-64
1410: 20 72 65 70 72 65 73 65 6e 74 61 74 69 6f 6e 20 representation
1420: 6f 66 20 61 20 70 6f 73 69 74 69 76 65 20 69 6e of a positive in
1430: 74 65 67 65 72 0a 2a 2f 0a 73 74 61 74 69 63 20 teger.*/.static
1440: 69 6e 74 20 64 69 67 69 74 5f 63 6f 75 6e 74 28 int digit_count(
1450: 69 6e 74 20 76 29 7b 0a 20 20 75 6e 73 69 67 6e int v){. unsign
1460: 65 64 20 69 6e 74 20 69 2c 20 78 3b 0a 20 20 66 ed int i, x;. f
1470: 6f 72 28 69 3d 31 2c 20 78 3d 36 34 3b 20 76 3e or(i=1, x=64; v>
1480: 3d 78 3b 20 69 2b 2b 2c 20 78 20 3c 3c 3d 20 36 =x; i++, x <<= 6
1490: 29 7b 7d 0a 20 20 72 65 74 75 72 6e 20 69 3b 0a ){}. return i;.
14a0: 7d 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d 70 75 74 65 }../*.** Compute
14b0: 20 61 20 33 32 2d 62 69 74 20 63 68 65 63 6b 73 a 32-bit checks
14c0: 75 6d 20 6f 6e 20 74 68 65 20 4e 2d 62 79 74 65 um on the N-byte
14d0: 20 62 75 66 66 65 72 2e 20 20 52 65 74 75 72 6e buffer. Return
14e0: 20 74 68 65 20 72 65 73 75 6c 74 2e 0a 2a 2f 0a the result..*/.
14f0: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20 static unsigned
1500: 69 6e 74 20 63 68 65 63 6b 73 75 6d 28 63 6f 6e int checksum(con
1510: 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69 6e st char *zIn, in
1520: 74 20 4e 29 7b 0a 20 20 63 6f 6e 73 74 20 75 6e t N){. const un
1530: 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d signed char *z =
1540: 20 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 (const unsigned
1550: 20 63 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 75 6e char*)zIn;. un
1560: 73 69 67 6e 65 64 20 69 6e 74 20 73 75 6d 20 3d signed int sum =
1570: 20 30 3b 0a 20 20 77 68 69 6c 65 28 20 4e 3e 3d 0;. while( N>=
1580: 34 20 29 7b 0a 20 20 20 20 73 75 6d 20 2b 3d 20 4 ){. sum +=
1590: 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c 20 28 7a 5b (z[0]<<24) | (z[
15a0: 31 5d 3c 3c 31 36 29 20 7c 20 28 7a 5b 32 5d 3c 1]<<16) | (z[2]<
15b0: 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a 20 20 20 20 <8) | z[3];.
15c0: 7a 20 2b 3d 20 34 3b 0a 20 20 20 20 4e 20 2d 3d z += 4;. N -=
15d0: 20 34 3b 0a 20 20 7d 0a 20 20 69 66 28 20 4e 3e 4;. }. if( N>
15e0: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 0 ){. unsigne
15f0: 64 20 63 68 61 72 20 7a 42 75 66 5b 34 5d 3b 0a d char zBuf[4];.
1600: 20 20 20 20 6d 65 6d 73 65 74 28 7a 42 75 66 2c memset(zBuf,
1610: 20 30 2c 20 73 69 7a 65 6f 66 28 7a 42 75 66 29 0, sizeof(zBuf)
1620: 29 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 42 );. memcpy(zB
1630: 75 66 2c 20 7a 2c 20 4e 29 3b 0a 20 20 20 20 7a uf, z, N);. z
1640: 20 3d 20 7a 42 75 66 3b 0a 20 20 20 20 73 75 6d = zBuf;. sum
1650: 20 2b 3d 20 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c += (z[0]<<24) |
1660: 20 28 7a 5b 31 5d 3c 3c 31 36 29 20 7c 20 28 7a (z[1]<<16) | (z
1670: 5b 32 5d 3c 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a [2]<<8) | z[3];.
1680: 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 73 75 6d }. return sum
1690: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 4d 61 78 69 6d ;.}../*.** Maxim
16a0: 75 6d 20 6e 75 6d 62 65 72 20 6f 66 20 6c 61 6e um number of lan
16b0: 64 6d 61 72 6b 73 20 74 6f 20 73 65 74 20 69 6e dmarks to set in
16c0: 20 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 the source file
16d0: 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4d 58 5f ..*/.#define MX_
16e0: 4c 41 4e 44 4d 41 52 4b 20 28 31 30 32 34 2a 31 LANDMARK (1024*1
16f0: 32 38 29 0a 0a 2f 2a 0a 2a 2a 20 43 72 65 61 74 28)../*.** Creat
1700: 65 20 61 20 6e 65 77 20 64 65 6c 74 61 2e 0a 2a e a new delta..*
1710: 2a 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 69 *.** The delta i
1720: 73 20 77 72 69 74 74 65 6e 20 69 6e 74 6f 20 61 s written into a
1730: 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 75 preallocated bu
1740: 66 66 65 72 2c 20 7a 44 65 6c 74 61 2c 20 77 68 ffer, zDelta, wh
1750: 69 63 68 20 0a 2a 2a 20 73 68 6f 75 6c 64 20 62 ich .** should b
1760: 65 20 61 74 20 6c 65 61 73 74 20 36 30 20 62 79 e at least 60 by
1770: 74 65 73 20 6c 6f 6e 67 65 72 20 74 68 61 6e 20 tes longer than
1780: 74 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 2c the target file,
1790: 20 7a 4f 75 74 2e 0a 2a 2a 20 54 68 65 20 64 65 zOut..** The de
17a0: 6c 74 61 20 73 74 72 69 6e 67 20 77 69 6c 6c 20 lta string will
17b0: 62 65 20 4e 55 4c 2d 74 65 72 6d 69 6e 61 74 65 be NUL-terminate
17c0: 64 2c 20 62 75 74 20 69 74 20 6d 69 67 68 74 20 d, but it might
17d0: 61 6c 73 6f 20 63 6f 6e 74 61 69 6e 0a 2a 2a 20 also contain.**
17e0: 65 6d 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61 embedded NUL cha
17f0: 72 61 63 74 65 72 73 20 69 66 20 65 69 74 68 65 racters if eithe
1800: 72 20 74 68 65 20 7a 53 72 63 20 6f 72 20 7a 4f r the zSrc or zO
1810: 75 74 20 66 69 6c 65 73 20 61 72 65 0a 2a 2a 20 ut files are.**
1820: 62 69 6e 61 72 79 2e 20 20 54 68 69 73 20 66 75 binary. This fu
1830: 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 20 74 nction returns t
1840: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65 he length of the
1850: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a 2a delta string.**
1860: 20 69 6e 20 62 79 74 65 73 2c 20 65 78 63 6c 75 in bytes, exclu
1870: 64 69 6e 67 20 74 68 65 20 66 69 6e 61 6c 20 4e ding the final N
1880: 55 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 UL terminator ch
1890: 61 72 61 63 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 4f aracter..**.** O
18a0: 75 74 70 75 74 20 46 6f 72 6d 61 74 3a 0a 2a 2a utput Format:.**
18b0: 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 62 65 .** The delta be
18c0: 67 69 6e 73 20 77 69 74 68 20 61 20 62 61 73 65 gins with a base
18d0: 36 34 20 6e 75 6d 62 65 72 20 66 6f 6c 6c 6f 77 64 number follow
18e0: 65 64 20 62 79 20 61 20 6e 65 77 6c 69 6e 65 2e ed by a newline.
18f0: 20 20 54 68 69 73 0a 2a 2a 20 6e 75 6d 62 65 72 This.** number
1900: 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 20 6f is the number o
1910: 66 20 62 79 74 65 73 20 69 6e 20 74 68 65 20 54 f bytes in the T
1920: 41 52 47 45 54 20 66 69 6c 65 2e 20 20 54 68 75 ARGET file. Thu
1930: 73 2c 20 67 69 76 65 6e 20 61 0a 2a 2a 20 64 65 s, given a.** de
1940: 6c 74 61 20 66 69 6c 65 20 7a 2c 20 61 20 70 72 lta file z, a pr
1950: 6f 67 72 61 6d 20 63 61 6e 20 63 6f 6d 70 75 74 ogram can comput
1960: 65 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 e the size of th
1970: 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a 2a e output file.**
1980: 20 73 69 6d 70 6c 79 20 62 79 20 72 65 61 64 69 simply by readi
1990: 6e 67 20 74 68 65 20 66 69 72 73 74 20 6c 69 6e ng the first lin
19a0: 65 20 61 6e 64 20 64 65 63 6f 64 69 6e 67 20 74 e and decoding t
19b0: 68 65 20 62 61 73 65 2d 36 34 20 6e 75 6d 62 65 he base-64 numbe
19c0: 72 0a 2a 2a 20 66 6f 75 6e 64 20 74 68 65 72 65 r.** found there
19d0: 2e 20 20 54 68 65 20 64 65 6c 74 61 5f 6f 75 74 . The delta_out
19e0: 70 75 74 5f 73 69 7a 65 28 29 20 72 6f 75 74 69 put_size() routi
19f0: 6e 65 20 64 6f 65 73 20 65 78 61 63 74 6c 79 20 ne does exactly
1a00: 74 68 69 73 2e 0a 2a 2a 0a 2a 2a 20 41 66 74 65 this..**.** Afte
1a10: 72 20 74 68 65 20 69 6e 69 74 69 61 6c 20 73 69 r the initial si
1a20: 7a 65 20 6e 75 6d 62 65 72 2c 20 74 68 65 20 64 ze number, the d
1a30: 65 6c 74 61 20 63 6f 6e 73 69 73 74 73 20 6f 66 elta consists of
1a40: 20 61 20 73 65 72 69 65 73 20 6f 66 0a 2a 2a 20 a series of.**
1a50: 6c 69 74 65 72 61 6c 20 74 65 78 74 20 73 65 67 literal text seg
1a60: 6d 65 6e 74 73 20 61 6e 64 20 63 6f 6d 6d 61 6e ments and comman
1a70: 64 73 20 74 6f 20 63 6f 70 79 20 66 72 6f 6d 20 ds to copy from
1a80: 74 68 65 20 53 4f 55 52 43 45 20 66 69 6c 65 2e the SOURCE file.
1a90: 20 20 0a 2a 2a 20 41 20 63 6f 70 79 20 63 6f 6d .** A copy com
1aa0: 6d 61 6e 64 20 6c 6f 6f 6b 73 20 6c 69 6b 65 20 mand looks like
1ab0: 74 68 69 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20 this:.**.**
1ac0: 4e 4e 4e 40 4d 4d 4d 2c 0a 2a 2a 0a 2a 2a 20 77 NNN@MMM,.**.** w
1ad0: 68 65 72 65 20 4e 4e 4e 20 69 73 20 74 68 65 20 here NNN is the
1ae0: 6e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73 20 number of bytes
1af0: 74 6f 20 62 65 20 63 6f 70 69 65 64 20 61 6e 64 to be copied and
1b00: 20 4d 4d 4d 20 69 73 20 74 68 65 20 6f 66 66 73 MMM is the offs
1b10: 65 74 0a 2a 2a 20 69 6e 74 6f 20 74 68 65 20 73 et.** into the s
1b20: 6f 75 72 63 65 20 66 69 6c 65 20 6f 66 20 74 68 ource file of th
1b30: 65 20 66 69 72 73 74 20 62 79 74 65 20 28 62 6f e first byte (bo
1b40: 74 68 20 62 61 73 65 2d 36 34 29 2e 20 20 20 49 th base-64). I
1b50: 66 20 4e 4e 4e 20 69 73 20 30 0a 2a 2a 20 69 74 f NNN is 0.** it
1b60: 20 6d 65 61 6e 73 20 63 6f 70 79 20 74 68 65 20 means copy the
1b70: 72 65 73 74 20 6f 66 20 74 68 65 20 69 6e 70 75 rest of the inpu
1b80: 74 20 66 69 6c 65 2e 20 20 4c 69 74 65 72 61 6c t file. Literal
1b90: 20 74 65 78 74 20 69 73 20 6c 69 6b 65 20 74 68 text is like th
1ba0: 69 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20 4e 4e is:.**.** NN
1bb0: 4e 3a 54 54 54 54 54 0a 2a 2a 0a 2a 2a 20 77 68 N:TTTTT.**.** wh
1bc0: 65 72 65 20 4e 4e 4e 20 69 73 20 74 68 65 20 6e ere NNN is the n
1bd0: 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73 20 6f umber of bytes o
1be0: 66 20 74 65 78 74 20 28 62 61 73 65 2d 36 34 29 f text (base-64)
1bf0: 20 61 6e 64 20 54 54 54 54 54 20 69 73 20 74 68 and TTTTT is th
1c00: 65 20 74 65 78 74 2e 0a 2a 2a 0a 2a 2a 20 54 68 e text..**.** Th
1c10: 65 20 6c 61 73 74 20 74 65 72 6d 20 69 73 20 6f e last term is o
1c20: 66 20 74 68 65 20 66 6f 72 6d 0a 2a 2a 0a 2a 2a f the form.**.**
1c30: 20 20 20 20 20 4e 4e 4e 3b 0a 2a 2a 0a 2a 2a 20 NNN;.**.**
1c40: 49 6e 20 74 68 69 73 20 63 61 73 65 2c 20 4e 4e In this case, NN
1c50: 4e 20 69 73 20 61 20 33 32 2d 62 69 74 20 62 69 N is a 32-bit bi
1c60: 67 65 6e 64 69 61 6e 20 63 68 65 63 6b 73 75 6d gendian checksum
1c70: 20 6f 66 20 74 68 65 20 6f 75 74 70 75 74 20 66 of the output f
1c80: 69 6c 65 0a 2a 2a 20 74 68 61 74 20 63 61 6e 20 ile.** that can
1c90: 62 65 20 75 73 65 64 20 74 6f 20 76 65 72 69 66 be used to verif
1ca0: 79 20 74 68 61 74 20 74 68 65 20 64 65 6c 74 61 y that the delta
1cb0: 20 61 70 70 6c 69 65 64 20 63 6f 72 72 65 63 74 applied correct
1cc0: 6c 79 2e 20 20 41 6c 6c 0a 2a 2a 20 6e 75 6d 62 ly. All.** numb
1cd0: 65 72 73 20 61 72 65 20 69 6e 20 62 61 73 65 2d ers are in base-
1ce0: 36 34 2e 0a 2a 2a 0a 2a 2a 20 50 75 72 65 20 74 64..**.** Pure t
1cf0: 65 78 74 20 66 69 6c 65 73 20 67 65 6e 65 72 61 ext files genera
1d00: 74 65 20 61 20 70 75 72 65 20 74 65 78 74 20 64 te a pure text d
1d10: 65 6c 74 61 2e 20 20 42 69 6e 61 72 79 20 66 69 elta. Binary fi
1d20: 6c 65 73 20 67 65 6e 65 72 61 74 65 20 61 0a 2a les generate a.*
1d30: 2a 20 64 65 6c 74 61 20 74 68 61 74 20 6d 61 79 * delta that may
1d40: 20 63 6f 6e 74 61 69 6e 20 73 6f 6d 65 20 62 69 contain some bi
1d50: 6e 61 72 79 20 64 61 74 61 2e 0a 2a 2a 0a 2a 2a nary data..**.**
1d60: 20 41 6c 67 6f 72 69 74 68 6d 3a 0a 2a 2a 0a 2a Algorithm:.**.*
1d70: 2a 20 54 68 65 20 65 6e 63 6f 64 65 72 20 66 69 * The encoder fi
1d80: 72 73 74 20 62 75 69 6c 64 73 20 61 20 68 61 73 rst builds a has
1d90: 68 20 74 61 62 6c 65 20 74 6f 20 68 65 6c 70 20 h table to help
1da0: 69 74 20 66 69 6e 64 20 6d 61 74 63 68 69 6e 67 it find matching
1db0: 0a 2a 2a 20 70 61 74 74 65 72 6e 73 20 69 6e 20 .** patterns in
1dc0: 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 2e the source file.
1dd0: 20 20 31 36 2d 62 79 74 65 20 63 68 75 6e 6b 73 16-byte chunks
1de0: 20 6f 66 20 74 68 65 20 73 6f 75 72 63 65 20 66 of the source f
1df0: 69 6c 65 0a 2a 2a 20 73 61 6d 70 6c 65 64 20 61 ile.** sampled a
1e00: 74 20 65 76 65 6e 6c 79 20 73 70 61 63 65 64 20 t evenly spaced
1e10: 69 6e 74 65 72 76 61 6c 73 20 61 72 65 20 75 73 intervals are us
1e20: 65 64 20 74 6f 20 70 6f 70 75 6c 61 74 65 20 74 ed to populate t
1e30: 68 65 20 68 61 73 68 0a 2a 2a 20 74 61 62 6c 65 he hash.** table
1e40: 2e 0a 2a 2a 0a 2a 2a 20 4e 65 78 74 20 77 65 20 ..**.** Next we
1e50: 62 65 67 69 6e 20 73 63 61 6e 6e 69 6e 67 20 74 begin scanning t
1e60: 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 20 75 he target file u
1e70: 73 69 6e 67 20 61 20 73 6c 69 64 69 6e 67 20 31 sing a sliding 1
1e80: 36 2d 62 79 74 65 0a 2a 2a 20 77 69 6e 64 6f 77 6-byte.** window
1e90: 2e 20 20 54 68 65 20 68 61 73 68 20 6f 66 20 74 . The hash of t
1ea0: 68 65 20 31 36 2d 62 79 74 65 20 77 69 6e 64 6f he 16-byte windo
1eb0: 77 20 69 6e 20 74 68 65 20 74 61 72 67 65 74 20 w in the target
1ec0: 69 73 20 75 73 65 64 20 74 6f 0a 2a 2a 20 73 65 is used to.** se
1ed0: 61 72 63 68 20 66 6f 72 20 61 20 6d 61 74 63 68 arch for a match
1ee0: 69 6e 67 20 73 65 63 74 69 6f 6e 20 69 6e 20 74 ing section in t
1ef0: 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 2e 20 he source file.
1f00: 20 57 68 65 6e 20 61 20 6d 61 74 63 68 0a 2a 2a When a match.**
1f10: 20 69 73 20 66 6f 75 6e 64 2c 20 61 20 63 6f 70 is found, a cop
1f20: 79 20 63 6f 6d 6d 61 6e 64 20 69 73 20 61 64 64 y command is add
1f30: 65 64 20 74 6f 20 74 68 65 20 64 65 6c 74 61 2e ed to the delta.
1f40: 20 20 41 6e 20 65 66 66 6f 72 74 20 69 73 0a 2a An effort is.*
1f50: 2a 20 6d 61 64 65 20 74 6f 20 65 78 74 65 6e 64 * made to extend
1f60: 20 74 68 65 20 6d 61 74 63 68 69 6e 67 20 73 65 the matching se
1f70: 63 74 69 6f 6e 20 74 6f 20 72 65 67 69 6f 6e 73 ction to regions
1f80: 20 74 68 61 74 20 63 6f 6d 65 20 62 65 66 6f 72 that come befor
1f90: 65 0a 2a 2a 20 61 6e 64 20 61 66 74 65 72 20 74 e.** and after t
1fa0: 68 65 20 31 36 2d 62 79 74 65 20 68 61 73 68 20 he 16-byte hash
1fb0: 77 69 6e 64 6f 77 2e 20 20 41 20 63 6f 70 79 20 window. A copy
1fc0: 63 6f 6d 6d 61 6e 64 20 69 73 20 6f 6e 6c 79 20 command is only
1fd0: 69 73 73 75 65 64 0a 2a 2a 20 69 66 20 74 68 65 issued.** if the
1fe0: 20 72 65 73 75 6c 74 20 77 6f 75 6c 64 20 75 73 result would us
1ff0: 65 20 6c 65 73 73 20 73 70 61 63 65 20 74 68 61 e less space tha
2000: 74 20 6a 75 73 74 20 71 75 6f 74 69 6e 67 20 74 t just quoting t
2010: 68 65 20 74 65 78 74 0a 2a 2a 20 6c 69 74 65 72 he text.** liter
2020: 61 6c 6c 79 2e 20 4c 69 74 65 72 61 6c 20 74 65 ally. Literal te
2030: 78 74 20 69 73 20 61 64 64 65 64 20 74 6f 20 74 xt is added to t
2040: 68 65 20 64 65 6c 74 61 20 66 6f 72 20 73 65 63 he delta for sec
2050: 74 69 6f 6e 73 20 74 68 61 74 20 0a 2a 2a 20 64 tions that .** d
2060: 6f 20 6e 6f 74 20 6d 61 74 63 68 20 6f 72 20 77 o not match or w
2070: 68 69 63 68 20 63 61 6e 20 6e 6f 74 20 62 65 20 hich can not be
2080: 65 6e 63 6f 64 65 64 20 65 66 66 69 63 69 65 6e encoded efficien
2090: 74 6c 79 20 75 73 69 6e 67 20 63 6f 70 79 0a 2a tly using copy.*
20a0: 2a 20 63 6f 6d 6d 61 6e 64 73 2e 0a 2a 2f 0a 69 * commands..*/.i
20b0: 6e 74 20 64 65 6c 74 61 5f 63 72 65 61 74 65 28 nt delta_create(
20c0: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a . const char *z
20d0: 53 72 63 2c 20 20 20 20 20 20 2f 2a 20 54 68 65 Src, /* The
20e0: 20 73 6f 75 72 63 65 20 6f 72 20 70 61 74 74 65 source or patte
20f0: 72 6e 20 66 69 6c 65 20 2a 2f 0a 20 20 75 6e 73 rn file */. uns
2100: 69 67 6e 65 64 20 69 6e 74 20 6c 65 6e 53 72 63 igned int lenSrc
2110: 2c 20 20 20 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 , /* Length of
2120: 20 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 the source file
2130: 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 */. const char
2140: 20 2a 7a 4f 75 74 2c 20 20 20 20 20 20 2f 2a 20 *zOut, /*
2150: 54 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 20 The target file
2160: 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e */. unsigned in
2170: 74 20 6c 65 6e 4f 75 74 2c 20 20 20 2f 2a 20 4c t lenOut, /* L
2180: 65 6e 67 74 68 20 6f 66 20 74 68 65 20 74 61 72 ength of the tar
2190: 67 65 74 20 66 69 6c 65 20 2a 2f 0a 20 20 63 68 get file */. ch
21a0: 61 72 20 2a 7a 44 65 6c 74 61 20 20 20 20 20 20 ar *zDelta
21b0: 20 20 20 20 20 2f 2a 20 57 72 69 74 65 20 74 68 /* Write th
21c0: 65 20 64 65 6c 74 61 20 69 6e 74 6f 20 74 68 69 e delta into thi
21d0: 73 20 62 75 66 66 65 72 20 2a 2f 0a 29 7b 0a 20 s buffer */.){.
21e0: 20 69 6e 74 20 69 2c 20 62 61 73 65 3b 0a 20 20 int i, base;.
21f0: 63 68 61 72 20 2a 7a 4f 72 69 67 44 65 6c 74 61 char *zOrigDelta
2200: 20 3d 20 7a 44 65 6c 74 61 3b 0a 20 20 68 61 73 = zDelta;. has
2210: 68 20 68 3b 0a 20 20 69 6e 74 20 2a 63 6f 6c 6c h h;. int *coll
2220: 69 64 65 3b 0a 20 20 69 6e 74 20 6c 61 73 74 52 ide;. int lastR
2230: 65 61 64 20 3d 20 2d 31 3b 20 20 20 20 20 20 20 ead = -1;
2240: 20 20 2f 2a 20 4c 61 73 74 20 62 79 74 65 20 6f /* Last byte o
2250: 66 20 7a 53 72 63 20 72 65 61 64 20 62 79 20 61 f zSrc read by a
2260: 20 43 4f 50 59 20 63 6f 6d 6d 61 6e 64 20 2a 2f COPY command */
2270: 0a 20 20 69 6e 74 20 6c 61 6e 64 6d 61 72 6b 5b . int landmark[
2280: 4d 58 5f 4c 41 4e 44 4d 41 52 4b 5d 3b 0a 0a 20 MX_LANDMARK];..
2290: 20 2f 2a 20 41 64 64 20 74 68 65 20 74 61 72 67 /* Add the targ
22a0: 65 74 20 66 69 6c 65 20 73 69 7a 65 20 74 6f 20 et file size to
22b0: 74 68 65 20 62 65 67 69 6e 6e 69 6e 67 20 6f 66 the beginning of
22c0: 20 74 68 65 20 64 65 6c 74 61 0a 20 20 2a 2f 0a the delta. */.
22d0: 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f 75 74 2c putInt(lenOut,
22e0: 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 2a 28 7a &zDelta);. *(z
22f0: 44 65 6c 74 61 2b 2b 29 20 3d 20 27 5c 6e 27 3b Delta++) = '\n';
2300: 0a 0a 20 20 2f 2a 20 49 66 20 74 68 65 20 73 6f .. /* If the so
2310: 75 72 63 65 20 66 69 6c 65 20 69 73 20 76 65 72 urce file is ver
2320: 79 20 73 6d 61 6c 6c 2c 20 69 74 20 6d 65 61 6e y small, it mean
2330: 73 20 74 68 61 74 20 77 65 20 68 61 76 65 20 6e s that we have n
2340: 6f 0a 20 20 2a 2a 20 63 68 61 6e 63 65 20 6f 66 o. ** chance of
2350: 20 65 76 65 72 20 64 6f 69 6e 67 20 61 20 63 6f ever doing a co
2360: 70 79 20 63 6f 6d 6d 61 6e 64 2e 20 20 4a 75 73 py command. Jus
2370: 74 20 6f 75 74 70 75 74 20 61 20 73 69 6e 67 6c t output a singl
2380: 65 0a 20 20 2a 2a 20 6c 69 74 65 72 61 6c 20 73 e. ** literal s
2390: 65 67 6d 65 6e 74 20 66 6f 72 20 74 68 65 20 65 egment for the e
23a0: 6e 74 69 72 65 20 74 61 72 67 65 74 20 61 6e 64 ntire target and
23b0: 20 65 78 69 74 2e 0a 20 20 2a 2f 0a 20 20 69 66 exit.. */. if
23c0: 28 20 6c 65 6e 53 72 63 3c 3d 4e 48 41 53 48 20 ( lenSrc<=NHASH
23d0: 29 7b 0a 20 20 20 20 70 75 74 49 6e 74 28 6c 65 ){. putInt(le
23e0: 6e 4f 75 74 2c 20 26 7a 44 65 6c 74 61 29 3b 0a nOut, &zDelta);.
23f0: 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 *(zDelta++)
2400: 3d 20 27 3a 27 3b 0a 20 20 20 20 6d 65 6d 63 70 = ':';. memcp
2410: 79 28 7a 44 65 6c 74 61 2c 20 7a 4f 75 74 2c 20 y(zDelta, zOut,
2420: 6c 65 6e 4f 75 74 29 3b 0a 20 20 20 20 7a 44 65 lenOut);. zDe
2430: 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 3b 0a 20 lta += lenOut;.
2440: 20 20 20 70 75 74 49 6e 74 28 63 68 65 63 6b 73 putInt(checks
2450: 75 6d 28 7a 4f 75 74 2c 20 6c 65 6e 4f 75 74 29 um(zOut, lenOut)
2460: 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 , &zDelta);.
2470: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3b *(zDelta++) = ';
2480: 27 3b 0a 20 20 20 20 72 65 74 75 72 6e 20 7a 44 ';. return zD
2490: 65 6c 74 61 20 2d 20 7a 4f 72 69 67 44 65 6c 74 elta - zOrigDelt
24a0: 61 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 43 6f 6d a;. }.. /* Com
24b0: 70 75 74 65 20 74 68 65 20 68 61 73 68 20 74 61 pute the hash ta
24c0: 62 6c 65 20 75 73 65 64 20 74 6f 20 6c 6f 63 61 ble used to loca
24d0: 74 65 20 6d 61 74 63 68 69 6e 67 20 73 65 63 74 te matching sect
24e0: 69 6f 6e 73 20 69 6e 20 74 68 65 0a 20 20 2a 2a ions in the. **
24f0: 20 73 6f 75 72 63 65 20 66 69 6c 65 2e 0a 20 20 source file..
2500: 2a 2f 0a 20 20 63 6f 6c 6c 69 64 65 20 3d 20 6d */. collide = m
2510: 61 6c 6c 6f 63 28 20 6c 65 6e 53 72 63 2a 73 69 alloc( lenSrc*si
2520: 7a 65 6f 66 28 69 6e 74 29 2f 4e 48 41 53 48 20 zeof(int)/NHASH
2530: 29 3b 0a 20 20 69 66 28 20 63 6f 6c 6c 69 64 65 );. if( collide
2540: 3d 3d 30 20 29 20 72 65 74 75 72 6e 20 2d 31 3b ==0 ) return -1;
2550: 0a 20 20 6d 65 6d 73 65 74 28 6c 61 6e 64 6d 61 . memset(landma
2560: 72 6b 2c 20 2d 31 2c 20 73 69 7a 65 6f 66 28 6c rk, -1, sizeof(l
2570: 61 6e 64 6d 61 72 6b 29 29 3b 0a 20 20 6d 65 6d andmark));. mem
2580: 73 65 74 28 63 6f 6c 6c 69 64 65 2c 20 2d 31 2c set(collide, -1,
2590: 20 6c 65 6e 53 72 63 2a 73 69 7a 65 6f 66 28 69 lenSrc*sizeof(i
25a0: 6e 74 29 2f 4e 48 41 53 48 20 29 3b 0a 20 20 66 nt)/NHASH );. f
25b0: 6f 72 28 69 3d 30 3b 20 69 3c 6c 65 6e 53 72 63 or(i=0; i<lenSrc
25c0: 2d 4e 48 41 53 48 3b 20 69 2b 3d 4e 48 41 53 48 -NHASH; i+=NHASH
25d0: 29 7b 0a 20 20 20 20 69 6e 74 20 68 76 3b 0a 20 ){. int hv;.
25e0: 20 20 20 68 61 73 68 5f 69 6e 69 74 28 26 68 2c hash_init(&h,
25f0: 20 26 7a 53 72 63 5b 69 5d 29 3b 0a 20 20 20 20 &zSrc[i]);.
2600: 68 76 20 3d 20 68 61 73 68 5f 33 32 62 69 74 28 hv = hash_32bit(
2610: 26 68 29 20 26 20 28 4d 58 5f 4c 41 4e 44 4d 41 &h) & (MX_LANDMA
2620: 52 4b 2d 31 29 3b 0a 20 20 20 20 63 6f 6c 6c 69 RK-1);. colli
2630: 64 65 5b 69 2f 4e 48 41 53 48 5d 20 3d 20 6c 61 de[i/NHASH] = la
2640: 6e 64 6d 61 72 6b 5b 68 76 5d 3b 0a 20 20 20 20 ndmark[hv];.
2650: 6c 61 6e 64 6d 61 72 6b 5b 68 76 5d 20 3d 20 69 landmark[hv] = i
2660: 2f 4e 48 41 53 48 3b 0a 20 20 7d 0a 0a 20 20 2f /NHASH;. }.. /
2670: 2a 20 42 65 67 69 6e 20 73 63 61 6e 6e 69 6e 67 * Begin scanning
2680: 20 74 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 the target file
2690: 20 61 6e 64 20 67 65 6e 65 72 61 74 69 6e 67 20 and generating
26a0: 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 73 20 61 6e copy commands an
26b0: 64 0a 20 20 2a 2a 20 6c 69 74 65 72 61 6c 20 73 d. ** literal s
26c0: 65 63 74 69 6f 6e 73 20 6f 66 20 74 68 65 20 64 ections of the d
26d0: 65 6c 74 61 2e 0a 20 20 2a 2f 0a 20 20 62 61 73 elta.. */. bas
26e0: 65 20 3d 20 30 3b 20 20 20 20 2f 2a 20 57 65 20 e = 0; /* We
26f0: 68 61 76 65 20 61 6c 72 65 61 64 79 20 67 65 6e have already gen
2700: 65 72 61 74 65 64 20 65 76 65 72 79 74 68 69 6e erated everythin
2710: 67 20 62 65 66 6f 72 65 20 7a 4f 75 74 5b 62 61 g before zOut[ba
2720: 73 65 5d 20 2a 2f 0a 20 20 77 68 69 6c 65 28 20 se] */. while(
2730: 62 61 73 65 2b 4e 48 41 53 48 3c 6c 65 6e 4f 75 base+NHASH<lenOu
2740: 74 20 29 7b 0a 20 20 20 20 69 6e 74 20 69 53 72 t ){. int iSr
2750: 63 2c 20 69 42 6c 6f 63 6b 3b 0a 20 20 20 20 75 c, iBlock;. u
2760: 6e 73 69 67 6e 65 64 20 69 6e 74 20 62 65 73 74 nsigned int best
2770: 43 6e 74 2c 20 62 65 73 74 4f 66 73 74 3d 30 2c Cnt, bestOfst=0,
2780: 20 62 65 73 74 4c 69 74 73 7a 3d 30 3b 0a 20 20 bestLitsz=0;.
2790: 20 20 68 61 73 68 5f 69 6e 69 74 28 26 68 2c 20 hash_init(&h,
27a0: 26 7a 4f 75 74 5b 62 61 73 65 5d 29 3b 0a 20 20 &zOut[base]);.
27b0: 20 20 69 20 3d 20 30 3b 20 20 20 20 20 2f 2a 20 i = 0; /*
27c0: 54 72 79 69 6e 67 20 74 6f 20 6d 61 74 63 68 20 Trying to match
27d0: 61 20 6c 61 6e 64 6d 61 72 6b 20 61 67 61 69 6e a landmark again
27e0: 73 74 20 7a 4f 75 74 5b 62 61 73 65 2b 69 5d 20 st zOut[base+i]
27f0: 2a 2f 0a 20 20 20 20 62 65 73 74 43 6e 74 20 3d */. bestCnt =
2800: 20 30 3b 0a 20 20 20 20 77 68 69 6c 65 28 20 31 0;. while( 1
2810: 20 29 7b 0a 20 20 20 20 20 20 69 6e 74 20 68 76 ){. int hv
2820: 3b 0a 20 20 20 20 20 20 69 6e 74 20 6c 69 6d 69 ;. int limi
2830: 74 20 3d 20 32 35 30 3b 0a 0a 20 20 20 20 20 20 t = 250;..
2840: 68 76 20 3d 20 68 61 73 68 5f 33 32 62 69 74 28 hv = hash_32bit(
2850: 26 68 29 20 26 20 28 4d 58 5f 4c 41 4e 44 4d 41 &h) & (MX_LANDMA
2860: 52 4b 2d 31 29 3b 0a 20 20 20 20 20 20 44 45 42 RK-1);. DEB
2870: 55 47 32 28 20 70 72 69 6e 74 66 28 22 4c 4f 4f UG2( printf("LOO
2880: 4b 49 4e 47 3a 20 25 34 64 20 5b 25 73 5d 5c 6e KING: %4d [%s]\n
2890: 22 2c 20 62 61 73 65 2b 69 2c 20 70 72 69 6e 74 ", base+i, print
28a0: 31 36 28 26 7a 4f 75 74 5b 62 61 73 65 2b 69 5d 16(&zOut[base+i]
28b0: 29 29 3b 20 29 0a 20 20 20 20 20 20 69 42 6c 6f )); ). iBlo
28c0: 63 6b 20 3d 20 6c 61 6e 64 6d 61 72 6b 5b 68 76 ck = landmark[hv
28d0: 5d 3b 0a 20 20 20 20 20 20 77 68 69 6c 65 28 20 ];. while(
28e0: 69 42 6c 6f 63 6b 3e 3d 30 20 26 26 20 28 6c 69 iBlock>=0 && (li
28f0: 6d 69 74 2d 2d 29 3e 30 20 29 7b 0a 20 20 20 20 mit--)>0 ){.
2900: 20 20 20 20 2f 2a 0a 20 20 20 20 20 20 20 20 2a /*. *
2910: 2a 20 54 68 65 20 68 61 73 68 20 77 69 6e 64 6f * The hash windo
2920: 77 20 68 61 73 20 69 64 65 6e 74 69 66 69 65 64 w has identified
2930: 20 61 20 70 6f 74 65 6e 74 69 61 6c 20 6d 61 74 a potential mat
2940: 63 68 20 61 67 61 69 6e 73 74 20 0a 20 20 20 20 ch against .
2950: 20 20 20 20 2a 2a 20 6c 61 6e 64 6d 61 72 6b 20 ** landmark
2960: 62 6c 6f 63 6b 20 69 42 6c 6f 63 6b 2e 20 20 42 block iBlock. B
2970: 75 74 20 77 65 20 6e 65 65 64 20 74 6f 20 69 6e ut we need to in
2980: 76 65 73 74 69 67 61 74 65 20 66 75 72 74 68 65 vestigate furthe
2990: 72 2e 0a 20 20 20 20 20 20 20 20 2a 2a 20 0a 20 r.. ** .
29a0: 20 20 20 20 20 20 20 2a 2a 20 4c 6f 6f 6b 20 66 ** Look f
29b0: 6f 72 20 61 20 72 65 67 69 6f 6e 20 69 6e 20 7a or a region in z
29c0: 4f 75 74 20 74 68 61 74 20 6d 61 74 63 68 65 73 Out that matches
29d0: 20 7a 53 72 63 2e 20 41 6e 63 68 6f 72 20 74 68 zSrc. Anchor th
29e0: 65 20 73 65 61 72 63 68 0a 20 20 20 20 20 20 20 e search.
29f0: 20 2a 2a 20 61 74 20 7a 53 72 63 5b 69 53 72 63 ** at zSrc[iSrc
2a00: 5d 20 61 6e 64 20 7a 4f 75 74 5b 62 61 73 65 2b ] and zOut[base+
2a10: 69 5d 2e 20 20 44 6f 20 6e 6f 74 20 69 6e 63 6c i]. Do not incl
2a20: 75 64 65 20 61 6e 79 74 68 69 6e 67 20 70 72 69 ude anything pri
2a30: 6f 72 20 74 6f 0a 20 20 20 20 20 20 20 20 2a 2a or to. **
2a40: 20 7a 4f 75 74 5b 62 61 73 65 5d 20 6f 72 20 61 zOut[base] or a
2a50: 66 74 65 72 20 7a 4f 75 74 5b 6f 75 74 4c 65 6e fter zOut[outLen
2a60: 5d 20 6e 6f 72 20 61 6e 79 74 68 69 6e 67 20 61 ] nor anything a
2a70: 66 74 65 72 20 7a 53 72 63 5b 73 72 63 4c 65 6e fter zSrc[srcLen
2a80: 5d 2e 0a 20 20 20 20 20 20 20 20 2a 2a 0a 20 20 ].. **.
2a90: 20 20 20 20 20 20 2a 2a 20 53 65 74 20 63 6e 74 ** Set cnt
2aa0: 20 65 71 75 61 6c 20 74 6f 20 74 68 65 20 6c 65 equal to the le
2ab0: 6e 67 74 68 20 6f 66 20 74 68 65 20 6d 61 74 63 ngth of the matc
2ac0: 68 20 61 6e 64 20 73 65 74 20 6f 66 73 74 20 73 h and set ofst s
2ad0: 6f 20 74 68 61 74 0a 20 20 20 20 20 20 20 20 2a o that. *
2ae0: 2a 20 7a 53 72 63 5b 6f 66 73 74 5d 20 69 73 20 * zSrc[ofst] is
2af0: 74 68 65 20 66 69 72 73 74 20 65 6c 65 6d 65 6e the first elemen
2b00: 74 20 6f 66 20 74 68 65 20 6d 61 74 63 68 2e 20 t of the match.
2b10: 20 6c 69 74 73 7a 20 69 73 20 74 68 65 20 6e 75 litsz is the nu
2b20: 6d 62 65 72 0a 20 20 20 20 20 20 20 20 2a 2a 20 mber. **
2b30: 6f 66 20 63 68 61 72 61 63 74 65 72 73 20 62 65 of characters be
2b40: 74 77 65 65 6e 20 7a 4f 75 74 5b 62 61 73 65 5d tween zOut[base]
2b50: 20 61 6e 64 20 74 68 65 20 62 65 67 69 6e 6e 69 and the beginni
2b60: 6e 67 20 6f 66 20 74 68 65 20 6d 61 74 63 68 2e ng of the match.
2b70: 0a 20 20 20 20 20 20 20 20 2a 2a 20 73 7a 20 77 . ** sz w
2b80: 69 6c 6c 20 62 65 20 74 68 65 20 6f 76 65 72 68 ill be the overh
2b90: 65 61 64 20 28 69 6e 20 62 79 74 65 73 29 20 6e ead (in bytes) n
2ba0: 65 65 64 65 64 20 74 6f 20 65 6e 63 6f 64 65 20 eeded to encode
2bb0: 74 68 65 20 63 6f 70 79 0a 20 20 20 20 20 20 20 the copy.
2bc0: 20 2a 2a 20 63 6f 6d 6d 61 6e 64 2e 20 20 4f 6e ** command. On
2bd0: 6c 79 20 67 65 6e 65 72 61 74 65 20 63 6f 70 79 ly generate copy
2be0: 20 63 6f 6d 6d 61 6e 64 20 69 66 20 74 68 65 20 command if the
2bf0: 6f 76 65 72 68 65 61 64 20 6f 66 20 74 68 65 0a overhead of the.
2c00: 20 20 20 20 20 20 20 20 2a 2a 20 63 6f 70 79 20 ** copy
2c10: 63 6f 6d 6d 61 6e 64 20 69 73 20 6c 65 73 73 20 command is less
2c20: 74 68 61 6e 20 74 68 65 20 61 6d 6f 75 6e 74 20 than the amount
2c30: 6f 66 20 6c 69 74 65 72 61 6c 20 74 65 78 74 20 of literal text
2c40: 74 6f 20 62 65 20 63 6f 70 69 65 64 2e 0a 20 20 to be copied..
2c50: 20 20 20 20 20 20 2a 2f 0a 20 20 20 20 20 20 20 */.
2c60: 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 2c 20 int cnt, ofst,
2c70: 6c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 69 litsz;. i
2c80: 6e 74 20 6a 2c 20 6b 2c 20 78 2c 20 79 3b 0a 20 nt j, k, x, y;.
2c90: 20 20 20 20 20 20 20 69 6e 74 20 73 7a 3b 0a 0a int sz;..
2ca0: 20 20 20 20 20 20 20 20 2f 2a 20 42 65 67 69 6e /* Begin
2cb0: 6e 69 6e 67 20 61 74 20 69 53 72 63 2c 20 6d 61 ning at iSrc, ma
2cc0: 74 63 68 20 66 6f 72 77 61 72 64 73 20 61 73 20 tch forwards as
2cd0: 66 61 72 20 61 73 20 77 65 20 63 61 6e 2e 20 20 far as we can.
2ce0: 6a 20 63 6f 75 6e 74 73 0a 20 20 20 20 20 20 20 j counts.
2cf0: 20 2a 2a 20 74 68 65 20 6e 75 6d 62 65 72 20 6f ** the number o
2d00: 66 20 63 68 61 72 61 63 74 65 72 73 20 74 68 61 f characters tha
2d10: 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20 20 t match */.
2d20: 20 20 20 69 53 72 63 20 3d 20 69 42 6c 6f 63 6b iSrc = iBlock
2d30: 2a 4e 48 41 53 48 3b 0a 20 20 20 20 20 20 20 20 *NHASH;.
2d40: 66 6f 72 28 6a 3d 30 2c 20 78 3d 69 53 72 63 2c for(j=0, x=iSrc,
2d50: 20 79 3d 62 61 73 65 2b 69 3b 20 78 3c 6c 65 6e y=base+i; x<len
2d60: 53 72 63 20 26 26 20 79 3c 6c 65 6e 4f 75 74 3b Src && y<lenOut;
2d70: 20 6a 2b 2b 2c 20 78 2b 2b 2c 20 79 2b 2b 29 7b j++, x++, y++){
2d80: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 7a . if( z
2d90: 53 72 63 5b 78 5d 21 3d 7a 4f 75 74 5b 79 5d 20 Src[x]!=zOut[y]
2da0: 29 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 20 ) break;.
2db0: 20 7d 0a 20 20 20 20 20 20 20 20 6a 2d 2d 3b 0a }. j--;.
2dc0: 0a 20 20 20 20 20 20 20 20 2f 2a 20 42 65 67 69 . /* Begi
2dd0: 6e 6e 69 6e 67 20 61 74 20 69 53 72 63 2d 31 2c nning at iSrc-1,
2de0: 20 6d 61 74 63 68 20 62 61 63 6b 77 61 72 64 73 match backwards
2df0: 20 61 73 20 66 61 72 20 61 73 20 77 65 20 63 61 as far as we ca
2e00: 6e 2e 20 20 6b 20 63 6f 75 6e 74 73 0a 20 20 20 n. k counts.
2e10: 20 20 20 20 20 2a 2a 20 74 68 65 20 6e 75 6d 62 ** the numb
2e20: 65 72 20 6f 66 20 63 68 61 72 61 63 74 65 72 73 er of characters
2e30: 20 74 68 61 74 20 6d 61 74 63 68 20 2a 2f 0a 20 that match */.
2e40: 20 20 20 20 20 20 20 66 6f 72 28 6b 3d 31 3b 20 for(k=1;
2e50: 6b 3c 69 53 72 63 20 26 26 20 6b 3c 3d 69 3b 20 k<iSrc && k<=i;
2e60: 6b 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20 20 k++){.
2e70: 69 66 28 20 7a 53 72 63 5b 69 53 72 63 2d 6b 5d if( zSrc[iSrc-k]
2e80: 21 3d 7a 4f 75 74 5b 62 61 73 65 2b 69 2d 6b 5d !=zOut[base+i-k]
2e90: 20 29 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 ) break;.
2ea0: 20 20 7d 0a 20 20 20 20 20 20 20 20 6b 2d 2d 3b }. k--;
2eb0: 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 43 6f 6d .. /* Com
2ec0: 70 75 74 65 20 74 68 65 20 6f 66 66 73 65 74 20 pute the offset
2ed0: 61 6e 64 20 73 69 7a 65 20 6f 66 20 74 68 65 20 and size of the
2ee0: 6d 61 74 63 68 69 6e 67 20 72 65 67 69 6f 6e 20 matching region
2ef0: 2a 2f 0a 20 20 20 20 20 20 20 20 6f 66 73 74 20 */. ofst
2f00: 3d 20 69 53 72 63 2d 6b 3b 0a 20 20 20 20 20 20 = iSrc-k;.
2f10: 20 20 63 6e 74 20 3d 20 6a 2b 6b 2b 31 3b 0a 20 cnt = j+k+1;.
2f20: 20 20 20 20 20 20 20 6c 69 74 73 7a 20 3d 20 69 litsz = i
2f30: 2d 6b 3b 20 20 2f 2a 20 4e 75 6d 62 65 72 20 6f -k; /* Number o
2f40: 66 20 62 79 74 65 73 20 6f 66 20 6c 69 74 65 72 f bytes of liter
2f50: 61 6c 20 74 65 78 74 20 62 65 66 6f 72 65 20 74 al text before t
2f60: 68 65 20 63 6f 70 79 20 2a 2f 0a 20 20 20 20 20 he copy */.
2f70: 20 20 20 44 45 42 55 47 32 28 20 70 72 69 6e 74 DEBUG2( print
2f80: 66 28 22 4d 41 54 43 48 20 25 64 20 62 79 74 65 f("MATCH %d byte
2f90: 73 20 61 74 20 25 64 3a 20 5b 25 73 5d 20 6c 69 s at %d: [%s] li
2fa0: 74 73 7a 3d 25 64 5c 6e 22 2c 0a 20 20 20 20 20 tsz=%d\n",.
2fb0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
2fc0: 20 20 20 63 6e 74 2c 20 6f 66 73 74 2c 20 70 72 cnt, ofst, pr
2fd0: 69 6e 74 31 36 28 26 7a 53 72 63 5b 6f 66 73 74 int16(&zSrc[ofst
2fe0: 5d 29 2c 20 6c 69 74 73 7a 29 3b 20 29 0a 20 20 ]), litsz); ).
2ff0: 20 20 20 20 20 20 2f 2a 20 73 7a 20 77 69 6c 6c /* sz will
3000: 20 68 6f 6c 64 20 74 68 65 20 6e 75 6d 62 65 72 hold the number
3010: 20 6f 66 20 62 79 74 65 73 20 6e 65 65 64 65 64 of bytes needed
3020: 20 74 6f 20 65 6e 63 6f 64 65 20 74 68 65 20 22 to encode the "
3030: 69 6e 73 65 72 74 22 0a 20 20 20 20 20 20 20 20 insert".
3040: 2a 2a 20 63 6f 6d 6d 61 6e 64 20 61 6e 64 20 74 ** command and t
3050: 68 65 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 2c he copy command,
3060: 20 6e 6f 74 20 63 6f 75 6e 74 69 6e 67 20 74 68 not counting th
3070: 65 20 22 69 6e 73 65 72 74 22 20 74 65 78 74 20 e "insert" text
3080: 2a 2f 0a 20 20 20 20 20 20 20 20 73 7a 20 3d 20 */. sz =
3090: 64 69 67 69 74 5f 63 6f 75 6e 74 28 69 2d 6b 29 digit_count(i-k)
30a0: 2b 64 69 67 69 74 5f 63 6f 75 6e 74 28 63 6e 74 +digit_count(cnt
30b0: 29 2b 64 69 67 69 74 5f 63 6f 75 6e 74 28 6f 66 )+digit_count(of
30c0: 73 74 29 2b 33 3b 0a 20 20 20 20 20 20 20 20 69 st)+3;. i
30d0: 66 28 20 63 6e 74 3e 3d 73 7a 20 26 26 20 63 6e f( cnt>=sz && cn
30e0: 74 3e 62 65 73 74 43 6e 74 20 29 7b 0a 20 20 20 t>bestCnt ){.
30f0: 20 20 20 20 20 20 20 2f 2a 20 52 65 6d 65 6d 62 /* Rememb
3100: 65 72 20 74 68 69 73 20 6d 61 74 63 68 20 6f 6e er this match on
3110: 6c 79 20 69 66 20 69 74 20 69 73 20 74 68 65 20 ly if it is the
3120: 62 65 73 74 20 73 6f 20 66 61 72 20 61 6e 64 20 best so far and
3130: 69 74 0a 20 20 20 20 20 20 20 20 20 20 2a 2a 20 it. **
3140: 64 6f 65 73 20 6e 6f 74 20 69 6e 63 72 65 61 73 does not increas
3150: 65 20 74 68 65 20 66 69 6c 65 20 73 69 7a 65 20 e the file size
3160: 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 62 65 73 */. bes
3170: 74 43 6e 74 20 3d 20 63 6e 74 3b 0a 20 20 20 20 tCnt = cnt;.
3180: 20 20 20 20 20 20 62 65 73 74 4f 66 73 74 20 3d bestOfst =
3190: 20 69 53 72 63 2d 6b 3b 0a 20 20 20 20 20 20 20 iSrc-k;.
31a0: 20 20 20 62 65 73 74 4c 69 74 73 7a 20 3d 20 6c bestLitsz = l
31b0: 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20 20 itsz;.
31c0: 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28 22 DEBUG2( printf("
31d0: 2e 2e 2e 20 42 45 53 54 20 53 4f 20 46 41 52 5c ... BEST SO FAR\
31e0: 6e 22 29 3b 20 29 0a 20 20 20 20 20 20 20 20 7d n"); ). }
31f0: 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 43 68 65 .. /* Che
3200: 63 6b 20 74 68 65 20 6e 65 78 74 20 6d 61 74 63 ck the next matc
3210: 68 69 6e 67 20 62 6c 6f 63 6b 20 2a 2f 0a 20 20 hing block */.
3220: 20 20 20 20 20 20 69 42 6c 6f 63 6b 20 3d 20 63 iBlock = c
3230: 6f 6c 6c 69 64 65 5b 69 42 6c 6f 63 6b 5d 3b 0a ollide[iBlock];.
3240: 20 20 20 20 20 20 7d 0a 0a 20 20 20 20 20 20 2f }.. /
3250: 2a 20 57 65 20 68 61 76 65 20 61 20 63 6f 70 79 * We have a copy
3260: 20 63 6f 6d 6d 61 6e 64 20 74 68 61 74 20 64 6f command that do
3270: 65 73 20 6e 6f 74 20 63 61 75 73 65 20 74 68 65 es not cause the
3280: 20 64 65 6c 74 61 20 74 6f 20 62 65 20 6c 61 72 delta to be lar
3290: 67 65 72 0a 20 20 20 20 20 20 2a 2a 20 74 68 61 ger. ** tha
32a0: 6e 20 61 20 6c 69 74 65 72 61 6c 20 69 6e 73 65 n a literal inse
32b0: 72 74 2e 20 20 53 6f 20 61 64 64 20 74 68 65 20 rt. So add the
32c0: 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20 74 6f 20 copy command to
32d0: 74 68 65 20 64 65 6c 74 61 2e 0a 20 20 20 20 20 the delta..
32e0: 20 2a 2f 0a 20 20 20 20 20 20 69 66 28 20 62 65 */. if( be
32f0: 73 74 43 6e 74 3e 30 20 29 7b 0a 20 20 20 20 20 stCnt>0 ){.
3300: 20 20 20 69 66 28 20 62 65 73 74 4c 69 74 73 7a if( bestLitsz
3310: 3e 30 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 >0 ){.
3320: 2f 2a 20 41 64 64 20 61 6e 20 69 6e 73 65 72 74 /* Add an insert
3330: 20 63 6f 6d 6d 61 6e 64 20 62 65 66 6f 72 65 20 command before
3340: 74 68 65 20 63 6f 70 79 20 2a 2f 0a 20 20 20 20 the copy */.
3350: 20 20 20 20 20 20 70 75 74 49 6e 74 28 62 65 73 putInt(bes
3360: 74 4c 69 74 73 7a 2c 26 7a 44 65 6c 74 61 29 3b tLitsz,&zDelta);
3370: 0a 20 20 20 20 20 20 20 20 20 20 2a 28 7a 44 65 . *(zDe
3380: 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 lta++) = ':';.
3390: 20 20 20 20 20 20 20 20 6d 65 6d 63 70 79 28 7a memcpy(z
33a0: 44 65 6c 74 61 2c 20 26 7a 4f 75 74 5b 62 61 73 Delta, &zOut[bas
33b0: 65 5d 2c 20 62 65 73 74 4c 69 74 73 7a 29 3b 0a e], bestLitsz);.
33c0: 20 20 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 zDelta
33d0: 20 2b 3d 20 62 65 73 74 4c 69 74 73 7a 3b 0a 20 += bestLitsz;.
33e0: 20 20 20 20 20 20 20 20 20 62 61 73 65 20 2b 3d base +=
33f0: 20 62 65 73 74 4c 69 74 73 7a 3b 0a 20 20 20 20 bestLitsz;.
3400: 20 20 20 20 20 20 44 45 42 55 47 32 28 20 70 72 DEBUG2( pr
3410: 69 6e 74 66 28 22 69 6e 73 65 72 74 20 25 64 5c intf("insert %d\
3420: 6e 22 2c 20 62 65 73 74 4c 69 74 73 7a 29 3b 20 n", bestLitsz);
3430: 29 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 ). }.
3440: 20 20 20 20 62 61 73 65 20 2b 3d 20 62 65 73 74 base += best
3450: 43 6e 74 3b 0a 20 20 20 20 20 20 20 20 70 75 74 Cnt;. put
3460: 49 6e 74 28 62 65 73 74 43 6e 74 2c 20 26 7a 44 Int(bestCnt, &zD
3470: 65 6c 74 61 29 3b 0a 20 20 20 20 20 20 20 20 2a elta);. *
3480: 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 40 27 (zDelta++) = '@'
3490: 3b 0a 20 20 20 20 20 20 20 20 70 75 74 49 6e 74 ;. putInt
34a0: 28 62 65 73 74 4f 66 73 74 2c 20 26 7a 44 65 6c (bestOfst, &zDel
34b0: 74 61 29 3b 0a 20 20 20 20 20 20 20 20 44 45 42 ta);. DEB
34c0: 55 47 32 28 20 70 72 69 6e 74 66 28 22 63 6f 70 UG2( printf("cop
34d0: 79 20 25 64 20 62 79 74 65 73 20 66 72 6f 6d 20 y %d bytes from
34e0: 25 64 5c 6e 22 2c 20 62 65 73 74 43 6e 74 2c 20 %d\n", bestCnt,
34f0: 62 65 73 74 4f 66 73 74 29 3b 20 29 0a 20 20 20 bestOfst); ).
3500: 20 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 *(zDelta++)
3510: 20 3d 20 27 2c 27 3b 0a 20 20 20 20 20 20 20 20 = ',';.
3520: 69 66 28 20 62 65 73 74 4f 66 73 74 20 2b 20 62 if( bestOfst + b
3530: 65 73 74 43 6e 74 20 2d 31 20 3e 20 6c 61 73 74 estCnt -1 > last
3540: 52 65 61 64 20 29 7b 0a 20 20 20 20 20 20 20 20 Read ){.
3550: 20 20 6c 61 73 74 52 65 61 64 20 3d 20 62 65 73 lastRead = bes
3560: 74 4f 66 73 74 20 2b 20 62 65 73 74 43 6e 74 20 tOfst + bestCnt
3570: 2d 20 31 3b 0a 20 20 20 20 20 20 20 20 20 20 44 - 1;. D
3580: 45 42 55 47 32 28 20 70 72 69 6e 74 66 28 22 6c EBUG2( printf("l
3590: 61 73 74 52 65 61 64 20 62 65 63 6f 6d 65 73 20 astRead becomes
35a0: 25 64 5c 6e 22 2c 20 6c 61 73 74 52 65 61 64 29 %d\n", lastRead)
35b0: 3b 20 29 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 ; ). }.
35c0: 20 20 20 20 20 20 62 65 73 74 43 6e 74 20 3d 20 bestCnt =
35d0: 30 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 0;. break
35e0: 3b 0a 20 20 20 20 20 20 7d 0a 0a 20 20 20 20 20 ;. }..
35f0: 20 2f 2a 20 49 66 20 77 65 20 72 65 61 63 68 20 /* If we reach
3600: 74 68 69 73 20 70 6f 69 6e 74 2c 20 69 74 20 6d this point, it m
3610: 65 61 6e 73 20 6e 6f 20 6d 61 74 63 68 20 69 73 eans no match is
3620: 20 66 6f 75 6e 64 20 73 6f 20 66 61 72 20 2a 2f found so far */
3630: 0a 20 20 20 20 20 20 69 66 28 20 62 61 73 65 2b . if( base+
3640: 69 2b 4e 48 41 53 48 3e 6c 65 6e 4f 75 74 20 29 i+NHASH>lenOut )
3650: 7b 0a 20 20 20 20 20 20 20 20 2f 2a 20 57 65 20 {. /* We
3660: 68 61 76 65 20 72 65 61 63 68 65 64 20 74 68 65 have reached the
3670: 20 65 6e 64 20 6f 66 20 74 68 65 20 66 69 6c 65 end of the file
3680: 20 61 6e 64 20 68 61 76 65 20 6e 6f 74 20 66 6f and have not fo
3690: 75 6e 64 20 61 6e 79 0a 20 20 20 20 20 20 20 20 und any.
36a0: 2a 2a 20 6d 61 74 63 68 65 73 2e 20 20 44 6f 20 ** matches. Do
36b0: 61 6e 20 22 69 6e 73 65 72 74 22 20 66 6f 72 20 an "insert" for
36c0: 65 76 65 72 79 74 68 69 6e 67 20 74 68 61 74 20 everything that
36d0: 64 6f 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 2a does not match *
36e0: 2f 0a 20 20 20 20 20 20 20 20 70 75 74 49 6e 74 /. putInt
36f0: 28 6c 65 6e 4f 75 74 2d 62 61 73 65 2c 20 26 7a (lenOut-base, &z
3700: 44 65 6c 74 61 29 3b 0a 20 20 20 20 20 20 20 20 Delta);.
3710: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3a *(zDelta++) = ':
3720: 27 3b 0a 20 20 20 20 20 20 20 20 6d 65 6d 63 70 ';. memcp
3730: 79 28 7a 44 65 6c 74 61 2c 20 26 7a 4f 75 74 5b y(zDelta, &zOut[
3740: 62 61 73 65 5d 2c 20 6c 65 6e 4f 75 74 2d 62 61 base], lenOut-ba
3750: 73 65 29 3b 0a 20 20 20 20 20 20 20 20 7a 44 65 se);. zDe
3760: 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 2d 62 61 lta += lenOut-ba
3770: 73 65 3b 0a 20 20 20 20 20 20 20 20 62 61 73 65 se;. base
3780: 20 3d 20 6c 65 6e 4f 75 74 3b 0a 20 20 20 20 20 = lenOut;.
3790: 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 break;.
37a0: 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 41 64 76 61 }.. /* Adva
37b0: 6e 63 65 20 74 68 65 20 68 61 73 68 20 62 79 20 nce the hash by
37c0: 6f 6e 65 20 63 68 61 72 61 63 74 65 72 2e 20 20 one character.
37d0: 4b 65 65 70 20 6c 6f 6f 6b 69 6e 67 20 66 6f 72 Keep looking for
37e0: 20 61 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20 a match */.
37f0: 20 20 68 61 73 68 5f 6e 65 78 74 28 26 68 2c 20 hash_next(&h,
3800: 7a 4f 75 74 5b 62 61 73 65 2b 69 2b 4e 48 41 53 zOut[base+i+NHAS
3810: 48 5d 29 3b 0a 20 20 20 20 20 20 69 2b 2b 3b 0a H]);. i++;.
3820: 20 20 20 20 7d 0a 20 20 7d 0a 20 20 2f 2a 20 4f }. }. /* O
3830: 75 74 70 75 74 20 61 20 66 69 6e 61 6c 20 22 69 utput a final "i
3840: 6e 73 65 72 74 22 20 72 65 63 6f 72 64 20 74 6f nsert" record to
3850: 20 67 65 74 20 61 6c 6c 20 74 68 65 20 74 65 78 get all the tex
3860: 74 20 61 74 20 74 68 65 20 65 6e 64 20 6f 66 0a t at the end of.
3870: 20 20 2a 2a 20 74 68 65 20 66 69 6c 65 20 74 68 ** the file th
3880: 61 74 20 64 6f 65 73 20 6e 6f 74 20 6d 61 74 63 at does not matc
3890: 68 20 61 6e 79 74 68 69 6e 67 20 69 6e 20 74 68 h anything in th
38a0: 65 20 73 6f 75 72 63 65 20 66 69 6c 65 2e 0a 20 e source file..
38b0: 20 2a 2f 0a 20 20 69 66 28 20 62 61 73 65 3c 6c */. if( base<l
38c0: 65 6e 4f 75 74 20 29 7b 0a 20 20 20 20 70 75 74 enOut ){. put
38d0: 49 6e 74 28 6c 65 6e 4f 75 74 2d 62 61 73 65 2c Int(lenOut-base,
38e0: 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 2a &zDelta);. *
38f0: 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 (zDelta++) = ':'
3900: 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 ;. memcpy(zDe
3910: 6c 74 61 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d lta, &zOut[base]
3920: 2c 20 6c 65 6e 4f 75 74 2d 62 61 73 65 29 3b 0a , lenOut-base);.
3930: 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d 20 6c 65 zDelta += le
3940: 6e 4f 75 74 2d 62 61 73 65 3b 0a 20 20 7d 0a 20 nOut-base;. }.
3950: 20 2f 2a 20 4f 75 74 70 75 74 20 74 68 65 20 66 /* Output the f
3960: 69 6e 61 6c 20 63 68 65 63 6b 73 75 6d 20 72 65 inal checksum re
3970: 63 6f 72 64 2e 20 2a 2f 0a 20 20 70 75 74 49 6e cord. */. putIn
3980: 74 28 63 68 65 63 6b 73 75 6d 28 7a 4f 75 74 2c t(checksum(zOut,
3990: 20 6c 65 6e 4f 75 74 29 2c 20 26 7a 44 65 6c 74 lenOut), &zDelt
39a0: 61 29 3b 0a 20 20 2a 28 7a 44 65 6c 74 61 2b 2b a);. *(zDelta++
39b0: 29 20 3d 20 27 3b 27 3b 0a 20 20 66 72 65 65 28 ) = ';';. free(
39c0: 63 6f 6c 6c 69 64 65 29 3b 0a 20 20 72 65 74 75 collide);. retu
39d0: 72 6e 20 7a 44 65 6c 74 61 20 2d 20 7a 4f 72 69 rn zDelta - zOri
39e0: 67 44 65 6c 74 61 3b 20 0a 7d 0a 0a 2f 2a 0a 2a gDelta; .}../*.*
39f0: 2a 20 52 65 74 75 72 6e 20 74 68 65 20 73 69 7a * Return the siz
3a00: 65 20 28 69 6e 20 62 79 74 65 73 29 20 6f 66 20 e (in bytes) of
3a10: 74 68 65 20 6f 75 74 70 75 74 20 66 72 6f 6d 20 the output from
3a20: 61 70 70 6c 79 69 6e 67 0a 2a 2a 20 61 20 64 65 applying.** a de
3a30: 6c 74 61 2e 20 0a 2a 2a 0a 2a 2a 20 54 68 69 73 lta. .**.** This
3a40: 20 72 6f 75 74 69 6e 65 20 69 73 20 70 72 6f 76 routine is prov
3a50: 69 64 65 64 20 73 6f 20 74 68 61 74 20 61 6e 20 ided so that an
3a60: 70 72 6f 63 65 64 75 72 65 20 74 68 61 74 20 69 procedure that i
3a70: 73 20 61 62 6c 65 0a 2a 2a 20 74 6f 20 63 61 6c s able.** to cal
3a80: 6c 20 64 65 6c 74 61 5f 61 70 70 6c 79 28 29 20 l delta_apply()
3a90: 63 61 6e 20 6c 65 61 72 6e 20 68 6f 77 20 6d 75 can learn how mu
3aa0: 63 68 20 73 70 61 63 65 20 69 73 20 72 65 71 75 ch space is requ
3ab0: 69 72 65 64 0a 2a 2a 20 66 6f 72 20 74 68 65 20 ired.** for the
3ac0: 6f 75 74 70 75 74 20 61 6e 64 20 68 65 6e 63 65 output and hence
3ad0: 20 61 6c 6c 6f 63 61 74 65 20 6e 6f 72 20 6d 6f allocate nor mo
3ae0: 72 65 20 73 70 61 63 65 20 74 68 61 74 20 69 73 re space that is
3af0: 20 72 65 61 6c 6c 79 0a 2a 2a 20 6e 65 65 64 65 really.** neede
3b00: 64 2e 0a 2a 2f 0a 69 6e 74 20 64 65 6c 74 61 5f d..*/.int delta_
3b10: 6f 75 74 70 75 74 5f 73 69 7a 65 28 63 6f 6e 73 output_size(cons
3b20: 74 20 63 68 61 72 20 2a 7a 44 65 6c 74 61 2c 20 t char *zDelta,
3b30: 69 6e 74 20 6c 65 6e 44 65 6c 74 61 29 7b 0a 20 int lenDelta){.
3b40: 20 69 6e 74 20 73 69 7a 65 3b 0a 20 20 73 69 7a int size;. siz
3b50: 65 20 3d 20 67 65 74 49 6e 74 28 26 7a 44 65 6c e = getInt(&zDel
3b60: 74 61 2c 20 26 6c 65 6e 44 65 6c 74 61 29 3b 0a ta, &lenDelta);.
3b70: 20 20 69 66 28 20 2a 7a 44 65 6c 74 61 21 3d 27 if( *zDelta!='
3b80: 5c 6e 27 20 29 7b 0a 20 20 20 20 2f 2a 20 45 52 \n' ){. /* ER
3b90: 52 4f 52 3a 20 73 69 7a 65 20 69 6e 74 65 67 65 ROR: size intege
3ba0: 72 20 6e 6f 74 20 74 65 72 6d 69 6e 61 74 65 64 r not terminated
3bb0: 20 62 79 20 22 5c 6e 22 20 2a 2f 0a 20 20 20 20 by "\n" */.
3bc0: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 7d 0a 20 return -1;. }.
3bd0: 20 72 65 74 75 72 6e 20 73 69 7a 65 3b 0a 7d 0a return size;.}.
3be0: 0a 0a 2f 2a 0a 2a 2a 20 41 70 70 6c 79 20 61 20 ../*.** Apply a
3bf0: 64 65 6c 74 61 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 delta..**.** The
3c00: 20 6f 75 74 70 75 74 20 62 75 66 66 65 72 20 73 output buffer s
3c10: 68 6f 75 6c 64 20 62 65 20 62 69 67 20 65 6e 6f hould be big eno
3c20: 75 67 68 20 74 6f 20 68 6f 6c 64 20 74 68 65 20 ugh to hold the
3c30: 77 68 6f 6c 65 20 6f 75 74 70 75 74 0a 2a 2a 20 whole output.**
3c40: 66 69 6c 65 20 61 6e 64 20 61 20 4e 55 4c 20 74 file and a NUL t
3c50: 65 72 6d 69 6e 61 74 6f 72 20 61 74 20 74 68 65 erminator at the
3c60: 20 65 6e 64 2e 20 20 54 68 65 20 64 65 6c 74 61 end. The delta
3c70: 5f 6f 75 74 70 75 74 5f 73 69 7a 65 28 29 0a 2a _output_size().*
3c80: 2a 20 72 6f 75 74 69 6e 65 20 77 69 6c 6c 20 64 * routine will d
3c90: 65 74 65 72 6d 69 6e 65 20 74 68 69 73 20 73 69 etermine this si
3ca0: 7a 65 20 66 6f 72 20 79 6f 75 2e 0a 2a 2a 0a 2a ze for you..**.*
3cb0: 2a 20 54 68 65 20 64 65 6c 74 61 20 73 74 72 69 * The delta stri
3cc0: 6e 67 20 73 68 6f 75 6c 64 20 62 65 20 6e 75 6c ng should be nul
3cd0: 6c 2d 74 65 72 6d 69 6e 61 74 65 64 2e 20 20 42 l-terminated. B
3ce0: 75 74 20 74 68 65 20 64 65 6c 74 61 20 73 74 72 ut the delta str
3cf0: 69 6e 67 0a 2a 2a 20 6d 61 79 20 63 6f 6e 74 61 ing.** may conta
3d00: 69 6e 20 65 6d 62 65 64 64 65 64 20 4e 55 4c 20 in embedded NUL
3d10: 63 68 61 72 61 63 74 65 72 73 20 28 69 66 20 74 characters (if t
3d20: 68 65 20 69 6e 70 75 74 20 61 6e 64 20 6f 75 74 he input and out
3d30: 70 75 74 20 61 72 65 0a 2a 2a 20 62 69 6e 61 72 put are.** binar
3d40: 79 20 66 69 6c 65 73 29 20 73 6f 20 77 65 20 61 y files) so we a
3d50: 6c 73 6f 20 68 61 76 65 20 74 6f 20 70 61 73 73 lso have to pass
3d60: 20 69 6e 20 74 68 65 20 6c 65 6e 67 74 68 20 6f in the length o
3d70: 66 20 74 68 65 20 64 65 6c 74 61 20 69 6e 0a 2a f the delta in.*
3d80: 2a 20 74 68 65 20 6c 65 6e 44 65 6c 74 61 20 70 * the lenDelta p
3d90: 61 72 61 6d 65 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 arameter..**.**
3da0: 54 68 69 73 20 66 75 6e 63 74 69 6f 6e 20 72 65 This function re
3db0: 74 75 72 6e 73 20 74 68 65 20 73 69 7a 65 20 6f turns the size o
3dc0: 66 20 74 68 65 20 6f 75 74 70 75 74 20 66 69 6c f the output fil
3dd0: 65 20 69 6e 20 62 79 74 65 73 20 28 65 78 63 6c e in bytes (excl
3de0: 75 64 69 6e 67 0a 2a 2a 20 74 68 65 20 66 69 6e uding.** the fin
3df0: 61 6c 20 4e 55 4c 20 74 65 72 6d 69 6e 61 74 6f al NUL terminato
3e00: 72 20 63 68 61 72 61 63 74 65 72 29 2e 20 20 45 r character). E
3e10: 78 63 65 70 74 2c 20 69 66 20 74 68 65 20 64 65 xcept, if the de
3e20: 6c 74 61 20 73 74 72 69 6e 67 20 69 73 0a 2a 2a lta string is.**
3e30: 20 6d 61 6c 66 6f 72 6d 65 64 20 6f 72 20 69 6e malformed or in
3e40: 74 65 6e 64 65 64 20 66 6f 72 20 75 73 65 20 77 tended for use w
3e50: 69 74 68 20 61 20 73 6f 75 72 63 65 20 66 69 6c ith a source fil
3e60: 65 20 6f 74 68 65 72 20 74 68 61 6e 20 7a 53 72 e other than zSr
3e70: 63 2c 0a 2a 2a 20 74 68 65 6e 20 74 68 69 73 20 c,.** then this
3e80: 72 6f 75 74 69 6e 65 20 72 65 74 75 72 6e 73 20 routine returns
3e90: 2d 31 2e 0a 2a 2a 0a 2a 2a 20 52 65 66 65 72 20 -1..**.** Refer
3ea0: 74 6f 20 74 68 65 20 64 65 6c 74 61 5f 63 72 65 to the delta_cre
3eb0: 61 74 65 28 29 20 64 6f 63 75 6d 65 6e 74 61 74 ate() documentat
3ec0: 69 6f 6e 20 61 62 6f 76 65 20 66 6f 72 20 61 20 ion above for a
3ed0: 64 65 73 63 72 69 70 74 69 6f 6e 0a 2a 2a 20 6f description.** o
3ee0: 66 20 74 68 65 20 64 65 6c 74 61 20 66 69 6c 65 f the delta file
3ef0: 20 66 6f 72 6d 61 74 2e 0a 2a 2f 0a 69 6e 74 20 format..*/.int
3f00: 64 65 6c 74 61 5f 61 70 70 6c 79 28 0a 20 20 63 delta_apply(. c
3f10: 6f 6e 73 74 20 63 68 61 72 20 2a 7a 53 72 63 2c onst char *zSrc,
3f20: 20 20 20 20 20 20 2f 2a 20 54 68 65 20 73 6f 75 /* The sou
3f30: 72 63 65 20 6f 72 20 70 61 74 74 65 72 6e 20 66 rce or pattern f
3f40: 69 6c 65 20 2a 2f 0a 20 20 69 6e 74 20 6c 65 6e ile */. int len
3f50: 53 72 63 2c 20 20 20 20 20 20 20 20 20 20 20 20 Src,
3f60: 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 65 /* Length of the
3f70: 20 73 6f 75 72 63 65 20 66 69 6c 65 20 2a 2f 0a source file */.
3f80: 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 44 const char *zD
3f90: 65 6c 74 61 2c 20 20 20 20 2f 2a 20 44 65 6c 74 elta, /* Delt
3fa0: 61 20 74 6f 20 61 70 70 6c 79 20 74 6f 20 74 68 a to apply to th
3fb0: 65 20 70 61 74 74 65 72 6e 20 2a 2f 0a 20 20 69 e pattern */. i
3fc0: 6e 74 20 6c 65 6e 44 65 6c 74 61 2c 20 20 20 20 nt lenDelta,
3fd0: 20 20 20 20 20 20 2f 2a 20 4c 65 6e 67 74 68 20 /* Length
3fe0: 6f 66 20 74 68 65 20 64 65 6c 74 61 20 2a 2f 0a of the delta */.
3ff0: 20 20 63 68 61 72 20 2a 7a 4f 75 74 20 20 20 20 char *zOut
4000: 20 20 20 20 20 20 20 20 20 2f 2a 20 57 72 69 74 /* Writ
4010: 65 20 74 68 65 20 6f 75 74 70 75 74 20 69 6e 74 e the output int
4020: 6f 20 74 68 69 73 20 70 72 65 61 6c 6c 6f 63 61 o this prealloca
4030: 74 65 64 20 62 75 66 66 65 72 20 2a 2f 0a 29 7b ted buffer */.){
4040: 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 20 . unsigned int
4050: 6c 69 6d 69 74 3b 0a 20 20 75 6e 73 69 67 6e 65 limit;. unsigne
4060: 64 20 69 6e 74 20 74 6f 74 61 6c 20 3d 20 30 3b d int total = 0;
4070: 0a 20 20 63 68 61 72 20 2a 7a 4f 72 69 67 4f 75 . char *zOrigOu
4080: 74 20 3d 20 7a 4f 75 74 3b 0a 0a 20 20 6c 69 6d t = zOut;.. lim
4090: 69 74 20 3d 20 67 65 74 49 6e 74 28 26 7a 44 65 it = getInt(&zDe
40a0: 6c 74 61 2c 20 26 6c 65 6e 44 65 6c 74 61 29 3b lta, &lenDelta);
40b0: 0a 20 20 69 66 28 20 2a 7a 44 65 6c 74 61 21 3d . if( *zDelta!=
40c0: 27 5c 6e 27 20 29 7b 0a 20 20 20 20 2f 2a 20 45 '\n' ){. /* E
40d0: 52 52 4f 52 3a 20 73 69 7a 65 20 69 6e 74 65 67 RROR: size integ
40e0: 65 72 20 6e 6f 74 20 74 65 72 6d 69 6e 61 74 65 er not terminate
40f0: 64 20 62 79 20 22 5c 6e 22 20 2a 2f 0a 20 20 20 d by "\n" */.
4100: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 7d 0a return -1;. }.
4110: 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 zDelta++; lenD
4120: 65 6c 74 61 2d 2d 3b 0a 20 20 77 68 69 6c 65 28 elta--;. while(
4130: 20 2a 7a 44 65 6c 74 61 20 26 26 20 6c 65 6e 44 *zDelta && lenD
4140: 65 6c 74 61 3e 30 20 29 7b 0a 20 20 20 20 75 6e elta>0 ){. un
4150: 73 69 67 6e 65 64 20 69 6e 74 20 63 6e 74 2c 20 signed int cnt,
4160: 6f 66 73 74 3b 0a 20 20 20 20 63 6e 74 20 3d 20 ofst;. cnt =
4170: 67 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 getInt(&zDelta,
4180: 26 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 20 20 &lenDelta);.
4190: 73 77 69 74 63 68 28 20 7a 44 65 6c 74 61 5b 30 switch( zDelta[0
41a0: 5d 20 29 7b 0a 20 20 20 20 20 20 63 61 73 65 20 ] ){. case
41b0: 27 40 27 3a 20 7b 0a 20 20 20 20 20 20 20 20 7a '@': {. z
41c0: 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 65 6c 74 Delta++; lenDelt
41d0: 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20 6f 66 73 a--;. ofs
41e0: 74 20 3d 20 67 65 74 49 6e 74 28 26 7a 44 65 6c t = getInt(&zDel
41f0: 74 61 2c 20 26 6c 65 6e 44 65 6c 74 61 29 3b 0a ta, &lenDelta);.
4200: 20 20 20 20 20 20 20 20 69 66 28 20 7a 44 65 6c if( zDel
4210: 74 61 5b 30 5d 21 3d 27 2c 27 20 29 7b 0a 20 20 ta[0]!=',' ){.
4220: 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 /* ERROR
4230: 3a 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20 6e : copy command n
4240: 6f 74 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 ot terminated by
4250: 20 27 2c 27 20 2a 2f 0a 20 20 20 20 20 20 20 20 ',' */.
4260: 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 return -1;.
4270: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 7a }. z
4280: 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 65 6c 74 Delta++; lenDelt
4290: 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20 44 45 42 a--;. DEB
42a0: 55 47 31 28 20 70 72 69 6e 74 66 28 22 43 4f 50 UG1( printf("COP
42b0: 59 20 25 64 20 66 72 6f 6d 20 25 64 5c 6e 22 2c Y %d from %d\n",
42c0: 20 63 6e 74 2c 20 6f 66 73 74 29 3b 20 29 0a 20 cnt, ofst); ).
42d0: 20 20 20 20 20 20 20 74 6f 74 61 6c 20 2b 3d 20 total +=
42e0: 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 69 66 28 cnt;. if(
42f0: 20 74 6f 74 61 6c 3e 6c 69 6d 69 74 20 29 7b 0a total>limit ){.
4300: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
4310: 4f 52 3a 20 63 6f 70 79 20 65 78 63 65 65 64 73 OR: copy exceeds
4320: 20 6f 75 74 70 75 74 20 66 69 6c 65 20 73 69 7a output file siz
4330: 65 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 e */. r
4340: 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 eturn -1;.
4350: 20 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20 }. if(
4360: 6f 66 73 74 2b 63 6e 74 20 3e 20 6c 65 6e 53 72 ofst+cnt > lenSr
4370: 63 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 2f c ){. /
4380: 2a 20 45 52 52 4f 52 3a 20 63 6f 70 79 20 65 78 * ERROR: copy ex
4390: 74 65 6e 64 73 20 70 61 73 74 20 65 6e 64 20 6f tends past end o
43a0: 66 20 69 6e 70 75 74 20 2a 2f 0a 20 20 20 20 20 f input */.
43b0: 20 20 20 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a return -1;.
43c0: 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 }.
43d0: 20 20 6d 65 6d 63 70 79 28 7a 4f 75 74 2c 20 26 memcpy(zOut, &
43e0: 7a 53 72 63 5b 6f 66 73 74 5d 2c 20 63 6e 74 29 zSrc[ofst], cnt)
43f0: 3b 0a 20 20 20 20 20 20 20 20 7a 4f 75 74 20 2b ;. zOut +
4400: 3d 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 62 = cnt;. b
4410: 72 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 reak;. }.
4420: 20 20 20 20 63 61 73 65 20 27 3a 27 3a 20 7b 0a case ':': {.
4430: 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 2b 2b zDelta++
4440: 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a 20 20 ; lenDelta--;.
4450: 20 20 20 20 20 20 74 6f 74 61 6c 20 2b 3d 20 63 total += c
4460: 6e 74 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 nt;. if(
4470: 74 6f 74 61 6c 3e 6c 69 6d 69 74 20 29 7b 0a 20 total>limit ){.
4480: 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 4f /* ERRO
4490: 52 3a 20 20 69 6e 73 65 72 74 20 63 6f 6d 6d 61 R: insert comma
44a0: 6e 64 20 67 69 76 65 73 20 61 6e 20 6f 75 74 70 nd gives an outp
44b0: 75 74 20 6c 61 72 67 65 72 20 74 68 61 6e 20 70 ut larger than p
44c0: 72 65 64 69 63 74 65 64 20 2a 2f 0a 20 20 20 20 redicted */.
44d0: 20 20 20 20 20 20 72 65 74 75 72 6e 20 2d 31 3b return -1;
44e0: 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 . }.
44f0: 20 20 20 44 45 42 55 47 31 28 20 70 72 69 6e 74 DEBUG1( print
4500: 66 28 22 49 4e 53 45 52 54 20 25 64 5c 6e 22 2c f("INSERT %d\n",
4510: 20 63 6e 74 29 3b 20 29 0a 20 20 20 20 20 20 20 cnt); ).
4520: 20 69 66 28 20 63 6e 74 3e 6c 65 6e 44 65 6c 74 if( cnt>lenDelt
4530: 61 20 29 7b 0a 20 20 20 20 20 20 20 20 20 20 2f a ){. /
4540: 2a 20 45 52 52 4f 52 3a 20 69 6e 73 65 72 74 20 * ERROR: insert
4550: 63 6f 75 6e 74 20 65 78 63 65 65 64 73 20 73 69 count exceeds si
4560: 7a 65 20 6f 66 20 64 65 6c 74 61 20 2a 2f 0a 20 ze of delta */.
4570: 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 return
4580: 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 -1;. }.
4590: 20 20 20 20 20 20 6d 65 6d 63 70 79 28 7a 4f 75 memcpy(zOu
45a0: 74 2c 20 7a 44 65 6c 74 61 2c 20 63 6e 74 29 3b t, zDelta, cnt);
45b0: 0a 20 20 20 20 20 20 20 20 7a 4f 75 74 20 2b 3d . zOut +=
45c0: 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 7a 44 cnt;. zD
45d0: 65 6c 74 61 20 2b 3d 20 63 6e 74 3b 0a 20 20 20 elta += cnt;.
45e0: 20 20 20 20 20 6c 65 6e 44 65 6c 74 61 20 2d 3d lenDelta -=
45f0: 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 62 72 cnt;. br
4600: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 eak;. }.
4610: 20 20 20 63 61 73 65 20 27 3b 27 3a 20 7b 0a 20 case ';': {.
4620: 20 20 20 20 20 20 20 7a 44 65 6c 74 61 2b 2b 3b zDelta++;
4630: 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a 20 20 20 lenDelta--;.
4640: 20 20 20 20 20 7a 4f 75 74 5b 30 5d 20 3d 20 30 zOut[0] = 0
4650: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 63 6e ;. if( cn
4660: 74 21 3d 63 68 65 63 6b 73 75 6d 28 7a 4f 72 69 t!=checksum(zOri
4670: 67 4f 75 74 2c 20 74 6f 74 61 6c 29 20 29 7b 0a gOut, total) ){.
4680: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
4690: 4f 52 3a 20 20 62 61 64 20 63 68 65 63 6b 73 75 OR: bad checksu
46a0: 6d 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 m */. r
46b0: 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 eturn -1;.
46c0: 20 20 7d 0a 20 20 20 20 20 20 20 20 69 66 28 20 }. if(
46d0: 74 6f 74 61 6c 21 3d 6c 69 6d 69 74 20 29 7b 0a total!=limit ){.
46e0: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
46f0: 4f 52 3a 20 67 65 6e 65 72 61 74 65 64 20 73 69 OR: generated si
4700: 7a 65 20 64 6f 65 73 20 6e 6f 74 20 6d 61 74 63 ze does not matc
4710: 68 20 70 72 65 64 69 63 74 65 64 20 73 69 7a 65 h predicted size
4720: 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 65 */. re
4730: 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 20 turn -1;.
4740: 20 7d 0a 20 20 20 20 20 20 20 20 72 65 74 75 72 }. retur
4750: 6e 20 74 6f 74 61 6c 3b 0a 20 20 20 20 20 20 7d n total;. }
4760: 0a 20 20 20 20 20 20 64 65 66 61 75 6c 74 3a 20 . default:
4770: 7b 0a 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 {. /* ERR
4780: 4f 52 3a 20 75 6e 6b 6e 6f 77 6e 20 64 65 6c 74 OR: unknown delt
4790: 61 20 6f 70 65 72 61 74 6f 72 20 2a 2f 0a 20 20 a operator */.
47a0: 20 20 20 20 20 20 72 65 74 75 72 6e 20 2d 31 3b return -1;
47b0: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 7d 0a 20 . }. }.
47c0: 20 7d 0a 20 20 2f 2a 20 45 52 52 4f 52 3a 20 75 }. /* ERROR: u
47d0: 6e 74 65 72 6d 69 6e 61 74 65 64 20 64 65 6c 74 nterminated delt
47e0: 61 20 2a 2f 0a 20 20 72 65 74 75 72 6e 20 2d 31 a */. return -1
47f0: 3b 0a 7d 0a ;.}.