0000: 2f 2a 0a 2a 2a 20 43 6f 70 79 72 69 67 68 74 20 /*.** Copyright
0010: 28 63 29 20 32 30 30 36 20 44 2e 20 52 69 63 68 (c) 2006 D. Rich
0020: 61 72 64 20 48 69 70 70 0a 2a 2a 0a 2a 2a 20 54 ard Hipp.**.** T
0030: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 66 his program is f
0040: 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 6f ree software; yo
0050: 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 75 u can redistribu
0060: 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 2a 2a 20 te it and/or.**
0070: 6d 6f 64 69 66 79 20 69 74 20 75 6e 64 65 72 20 modify it under
0080: 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65 the terms of the
0090: 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 75 62 GNU General Pub
00a0: 6c 69 63 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 76 lic.** License v
00b0: 65 72 73 69 6f 6e 20 32 20 61 73 20 70 75 62 6c ersion 2 as publ
00c0: 69 73 68 65 64 20 62 79 20 74 68 65 20 46 72 65 ished by the Fre
00d0: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
00e0: 61 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 ation..**.** Thi
00f0: 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 69 73 s program is dis
0100: 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 65 20 tributed in the
0110: 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 69 6c hope that it wil
0120: 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 2a 2a 20 l be useful,.**
0130: 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e 59 20 but WITHOUT ANY
0140: 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 6f 75 WARRANTY; withou
0150: 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c 69 t even the impli
0160: 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a 2a ed warranty of.*
0170: 2a 20 4d 45 52 43 48 41 4e 54 41 42 49 4c 49 54 * MERCHANTABILIT
0180: 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 4f 52 Y or FITNESS FOR
0190: 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 50 55 A PARTICULAR PU
01a0: 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 65 20 RPOSE. See the
01b0: 47 4e 55 0a 2a 2a 20 47 65 6e 65 72 61 6c 20 50 GNU.** General P
01c0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 66 6f ublic License fo
01d0: 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 2e 0a r more details..
01e0: 2a 2a 20 0a 2a 2a 20 59 6f 75 20 73 68 6f 75 6c ** .** You shoul
01f0: 64 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 d have received
0200: 61 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e a copy of the GN
0210: 55 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 U General Public
0220: 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 61 6c 6f 6e .** License alon
0230: 67 20 77 69 74 68 20 74 68 69 73 20 6c 69 62 72 g with this libr
0240: 61 72 79 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 ary; if not, wri
0250: 74 65 20 74 6f 20 74 68 65 0a 2a 2a 20 46 72 65 te to the.** Fre
0260: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
0270: 61 74 69 6f 6e 2c 20 49 6e 63 2e 2c 20 35 39 20 ation, Inc., 59
0280: 54 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53 Temple Place - S
0290: 75 69 74 65 20 33 33 30 2c 0a 2a 2a 20 42 6f 73 uite 330,.** Bos
02a0: 74 6f 6e 2c 20 4d 41 20 20 30 32 31 31 31 2d 31 ton, MA 02111-1
02b0: 33 30 37 2c 20 55 53 41 2e 0a 2a 2a 0a 2a 2a 20 307, USA..**.**
02c0: 41 75 74 68 6f 72 20 63 6f 6e 74 61 63 74 20 69 Author contact i
02d0: 6e 66 6f 72 6d 61 74 69 6f 6e 3a 0a 2a 2a 20 20 nformation:.**
02e0: 20 64 72 68 40 68 77 61 63 69 2e 63 6f 6d 0a 2a drh@hwaci.com.*
02f0: 2a 20 20 20 68 74 74 70 3a 2f 2f 77 77 77 2e 68 * http://www.h
0300: 77 61 63 69 2e 63 6f 6d 2f 64 72 68 2f 0a 2a 2a waci.com/drh/.**
0310: 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a .***************
0320: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0330: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0340: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0350: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0360: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 6d 6f 64 75 .**.** This modu
0370: 6c 65 20 69 6d 70 6c 65 6d 65 6e 74 73 20 74 68 le implements th
0380: 65 20 64 65 6c 74 61 20 63 6f 6d 70 72 65 73 73 e delta compress
0390: 20 61 6c 67 6f 72 69 74 68 6d 2e 0a 2a 2a 0a 2a algorithm..**.*
03a0: 2a 20 54 68 6f 75 67 68 20 64 65 76 65 6c 6f 70 * Though develop
03b0: 65 64 20 73 70 65 63 69 66 69 63 61 6c 6c 79 20 ed specifically
03c0: 66 6f 72 20 66 6f 73 73 69 6c 2c 20 74 68 65 20 for fossil, the
03d0: 63 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c code in this fil
03e0: 65 0a 2a 2a 20 69 73 20 67 65 6e 65 72 61 6c 6c e.** is generall
03f0: 79 20 61 70 70 6c 69 61 62 6c 65 20 61 6e 64 20 y appliable and
0400: 69 73 20 74 68 75 73 20 65 61 73 69 6c 79 20 73 is thus easily s
0410: 65 70 61 72 61 74 65 64 20 66 72 6f 6d 20 74 68 eparated from th
0420: 65 0a 2a 2a 20 66 6f 73 73 69 6c 20 73 6f 75 72 e.** fossil sour
0430: 63 65 20 63 6f 64 65 20 62 61 73 65 2e 20 20 4e ce code base. N
0440: 6f 74 68 69 6e 67 20 69 6e 20 74 68 69 73 20 66 othing in this f
0450: 69 6c 65 20 64 65 70 65 6e 64 73 20 6f 6e 20 61 ile depends on a
0460: 6e 79 74 68 69 6e 67 0a 2a 2a 20 65 6c 73 65 20 nything.** else
0470: 69 6e 20 66 6f 73 73 69 6c 2e 0a 2a 2f 0a 23 69 in fossil..*/.#i
0480: 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68 3e nclude <stdio.h>
0490: 0a 23 69 6e 63 6c 75 64 65 20 3c 61 73 73 65 72 .#include <asser
04a0: 74 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 t.h>.#include <s
04b0: 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64 tdlib.h>.#includ
04c0: 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a e <string.h>../*
04d0: 0a 2a 2a 20 4d 61 63 72 6f 73 20 66 6f 72 20 74 .** Macros for t
04e0: 75 72 6e 69 6e 67 20 64 65 62 75 67 67 69 6e 67 urning debugging
04f0: 20 70 72 69 6e 74 66 73 20 6f 6e 20 61 6e 64 20 printfs on and
0500: 6f 66 66 0a 2a 2f 0a 23 69 66 20 30 0a 23 20 64 off.*/.#if 0.# d
0510: 65 66 69 6e 65 20 44 45 42 55 47 31 28 58 29 20 efine DEBUG1(X)
0520: 58 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 6e 65 X.#else.# define
0530: 20 44 45 42 55 47 31 28 58 29 0a 23 65 6e 64 69 DEBUG1(X).#endi
0540: 66 0a 23 69 66 20 30 0a 23 64 65 66 69 6e 65 20 f.#if 0.#define
0550: 44 45 42 55 47 32 28 58 29 20 58 0a 2f 2a 0a 2a DEBUG2(X) X./*.*
0560: 2a 20 46 6f 72 20 64 65 62 75 67 67 69 6e 67 3a * For debugging:
0570: 0a 2a 2a 20 50 72 69 6e 74 20 31 36 20 63 68 61 .** Print 16 cha
0580: 72 61 63 74 65 72 73 20 6f 66 20 74 65 78 74 20 racters of text
0590: 66 72 6f 6d 20 7a 42 75 66 0a 2a 2f 0a 73 74 61 from zBuf.*/.sta
05a0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a tic const char *
05b0: 70 72 69 6e 74 31 36 28 63 6f 6e 73 74 20 63 68 print16(const ch
05c0: 61 72 20 2a 7a 29 7b 0a 20 20 69 6e 74 20 69 3b ar *z){. int i;
05d0: 0a 20 20 73 74 61 74 69 63 20 63 68 61 72 20 7a . static char z
05e0: 42 75 66 5b 32 30 5d 3b 0a 20 20 66 6f 72 28 69 Buf[20];. for(i
05f0: 3d 30 3b 20 69 3c 31 36 3b 20 69 2b 2b 29 7b 0a =0; i<16; i++){.
0600: 20 20 20 20 69 66 28 20 7a 5b 69 5d 3e 3d 30 78 if( z[i]>=0x
0610: 32 30 20 26 26 20 7a 5b 69 5d 3c 3d 30 78 37 65 20 && z[i]<=0x7e
0620: 20 29 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b 69 ){. zBuf[i
0630: 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 7d 65 ] = z[i];. }e
0640: 6c 73 65 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b lse{. zBuf[
0650: 69 5d 20 3d 20 27 2e 27 3b 0a 20 20 20 20 7d 0a i] = '.';. }.
0660: 20 20 7d 0a 20 20 7a 42 75 66 5b 69 5d 20 3d 20 }. zBuf[i] =
0670: 30 3b 0a 20 20 72 65 74 75 72 6e 20 7a 42 75 66 0;. return zBuf
0680: 3b 0a 7d 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 ;.}.#else.# defi
0690: 6e 65 20 44 45 42 55 47 32 28 58 29 0a 23 65 6e ne DEBUG2(X).#en
06a0: 64 69 66 0a 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 dif.../*.** The
06b0: 22 75 33 32 22 20 74 79 70 65 20 6d 75 73 74 20 "u32" type must
06c0: 62 65 20 61 6e 20 75 6e 73 69 67 6e 65 64 20 33 be an unsigned 3
06d0: 32 2d 62 69 74 20 69 6e 74 65 67 65 72 2e 20 20 2-bit integer.
06e0: 41 64 6a 75 73 74 20 74 68 69 73 0a 2a 2f 0a 74 Adjust this.*/.t
06f0: 79 70 65 64 65 66 20 75 6e 73 69 67 6e 65 64 20 ypedef unsigned
0700: 69 6e 74 20 75 33 32 3b 0a 0a 2f 2a 0a 2a 2a 20 int u32;../*.**
0710: 4d 75 73 74 20 62 65 20 61 20 31 36 2d 62 69 74 Must be a 16-bit
0720: 20 76 61 6c 75 65 20 0a 2a 2f 0a 74 79 70 65 64 value .*/.typed
0730: 65 66 20 73 68 6f 72 74 20 69 6e 74 20 73 31 36 ef short int s16
0740: 3b 0a 74 79 70 65 64 65 66 20 75 6e 73 69 67 6e ;.typedef unsign
0750: 65 64 20 73 68 6f 72 74 20 69 6e 74 20 75 31 36 ed short int u16
0760: 3b 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 77 69 64 ;../*.** The wid
0770: 74 68 20 6f 66 20 61 20 68 61 73 68 20 77 69 6e th of a hash win
0780: 64 6f 77 20 69 6e 20 62 79 74 65 73 2e 20 20 54 dow in bytes. T
0790: 68 65 20 61 6c 67 6f 72 69 74 68 6d 20 6f 6e 6c he algorithm onl
07a0: 79 20 77 6f 72 6b 73 20 69 66 20 74 68 69 73 0a y works if this.
07b0: 2a 2a 20 69 73 20 61 20 70 6f 77 65 72 20 6f 66 ** is a power of
07c0: 20 32 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4e 2..*/.#define N
07d0: 48 41 53 48 20 31 36 0a 0a 2f 2a 0a 2a 2a 20 54 HASH 16../*.** T
07e0: 68 65 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 he current state
07f0: 20 6f 66 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 of the rolling
0800: 68 61 73 68 2e 0a 2a 2a 0a 2a 2a 20 7a 5b 5d 20 hash..**.** z[]
0810: 68 6f 6c 64 73 20 74 68 65 20 76 61 6c 75 65 73 holds the values
0820: 20 74 68 61 74 20 68 61 76 65 20 62 65 65 6e 20 that have been
0830: 68 61 73 68 65 64 2e 20 20 7a 5b 5d 20 69 73 20 hashed. z[] is
0840: 61 20 63 69 72 63 75 6c 61 72 20 62 75 66 66 65 a circular buffe
0850: 72 2e 0a 2a 2a 20 7a 5b 69 5d 20 69 73 20 74 68 r..** z[i] is th
0860: 65 20 66 69 72 73 74 20 65 6e 74 72 79 20 61 6e e first entry an
0870: 64 20 7a 5b 28 69 2b 4e 48 41 53 48 2d 31 29 25 d z[(i+NHASH-1)%
0880: 4e 48 41 53 48 5d 20 69 73 20 74 68 65 20 6c 61 NHASH] is the la
0890: 73 74 20 65 6e 74 72 79 20 6f 66 20 0a 2a 2a 20 st entry of .**
08a0: 74 68 65 20 77 69 6e 64 6f 77 2e 0a 2a 2a 0a 2a the window..**.*
08b0: 2a 20 48 61 73 68 2e 61 20 69 73 20 74 68 65 20 * Hash.a is the
08c0: 73 75 6d 20 6f 66 20 61 6c 6c 20 65 6c 65 6d 65 sum of all eleme
08d0: 6e 74 73 20 6f 66 20 68 61 73 68 2e 7a 5b 5d 2e nts of hash.z[].
08e0: 20 20 48 61 73 68 2e 62 20 69 73 20 61 20 77 65 Hash.b is a we
08f0: 69 67 68 74 65 64 0a 2a 2a 20 73 75 6d 2e 20 20 ighted.** sum.
0900: 48 61 73 68 2e 62 20 69 73 20 7a 5b 69 5d 2a 4e Hash.b is z[i]*N
0910: 48 41 53 48 20 2b 20 7a 5b 69 2b 31 5d 2a 28 4e HASH + z[i+1]*(N
0920: 48 41 53 48 2d 31 29 20 2b 20 2e 2e 2e 20 2b 20 HASH-1) + ... +
0930: 7a 5b 69 2b 4e 48 41 53 48 2d 31 5d 2a 31 2e 0a z[i+NHASH-1]*1..
0940: 2a 2a 20 28 45 61 63 68 20 69 6e 64 65 78 20 66 ** (Each index f
0950: 6f 72 20 7a 5b 5d 20 73 68 6f 75 6c 64 20 62 65 or z[] should be
0960: 20 6d 6f 64 75 6c 65 20 4e 48 41 53 48 2c 20 6f module NHASH, o
0970: 66 20 63 6f 75 72 73 65 2e 20 20 54 68 65 20 25 f course. The %
0980: 4e 48 41 53 48 20 6f 70 65 72 61 74 6f 72 0a 2a NHASH operator.*
0990: 2a 20 69 73 20 6f 6d 69 74 74 65 64 20 69 6e 20 * is omitted in
09a0: 74 68 65 20 70 72 69 6f 72 20 65 78 70 72 65 73 the prior expres
09b0: 73 69 6f 6e 20 66 6f 72 20 62 72 65 76 69 74 79 sion for brevity
09c0: 2e 29 0a 2a 2f 0a 74 79 70 65 64 65 66 20 73 74 .).*/.typedef st
09d0: 72 75 63 74 20 68 61 73 68 20 68 61 73 68 3b 0a ruct hash hash;.
09e0: 73 74 72 75 63 74 20 68 61 73 68 20 7b 0a 20 20 struct hash {.
09f0: 75 31 36 20 61 2c 20 62 3b 20 20 20 20 20 20 20 u16 a, b;
0a00: 20 20 2f 2a 20 48 61 73 68 20 76 61 6c 75 65 73 /* Hash values
0a10: 20 2a 2f 0a 20 20 75 31 36 20 69 3b 20 20 20 20 */. u16 i;
0a20: 20 20 20 20 20 20 20 20 2f 2a 20 53 74 61 72 74 /* Start
0a30: 20 6f 66 20 74 68 65 20 68 61 73 68 20 77 69 6e of the hash win
0a40: 64 6f 77 20 2a 2f 0a 20 20 63 68 61 72 20 7a 5b dow */. char z[
0a50: 4e 48 41 53 48 5d 3b 20 20 20 20 2f 2a 20 54 68 NHASH]; /* Th
0a60: 65 20 76 61 6c 75 65 73 20 74 68 61 74 20 68 61 e values that ha
0a70: 76 65 20 62 65 65 6e 20 68 61 73 68 65 64 20 2a ve been hashed *
0a80: 2f 0a 7d 3b 0a 0a 2f 2a 0a 2a 2a 20 49 6e 69 74 /.};../*.** Init
0a90: 69 61 6c 69 7a 65 20 74 68 65 20 72 6f 6c 6c 69 ialize the rolli
0aa0: 6e 67 20 68 61 73 68 20 75 73 69 6e 67 20 74 68 ng hash using th
0ab0: 65 20 66 69 72 73 74 20 4e 48 41 53 48 20 63 68 e first NHASH ch
0ac0: 61 72 61 63 74 65 72 73 20 6f 66 20 7a 5b 5d 0a aracters of z[].
0ad0: 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 */.static void h
0ae0: 61 73 68 5f 69 6e 69 74 28 68 61 73 68 20 2a 70 ash_init(hash *p
0af0: 48 61 73 68 2c 20 63 6f 6e 73 74 20 63 68 61 72 Hash, const char
0b00: 20 2a 7a 29 7b 0a 20 20 75 31 36 20 61 2c 20 62 *z){. u16 a, b
0b10: 2c 20 69 3b 0a 20 20 61 20 3d 20 62 20 3d 20 30 , i;. a = b = 0
0b20: 3b 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 4e ;. for(i=0; i<N
0b30: 48 41 53 48 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 HASH; i++){.
0b40: 61 20 2b 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 62 a += z[i];. b
0b50: 20 2b 3d 20 28 4e 48 41 53 48 2d 69 29 2a 7a 5b += (NHASH-i)*z[
0b60: 69 5d 3b 0a 20 20 20 20 70 48 61 73 68 2d 3e 7a i];. pHash->z
0b70: 5b 69 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 7d 0a [i] = z[i];. }.
0b80: 20 20 70 48 61 73 68 2d 3e 61 20 3d 20 61 20 26 pHash->a = a &
0b90: 20 30 78 66 66 66 66 3b 0a 20 20 70 48 61 73 68 0xffff;. pHash
0ba0: 2d 3e 62 20 3d 20 62 20 26 20 30 78 66 66 66 66 ->b = b & 0xffff
0bb0: 3b 0a 20 20 70 48 61 73 68 2d 3e 69 20 3d 20 30 ;. pHash->i = 0
0bc0: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 41 64 76 61 6e ;.}../*.** Advan
0bd0: 63 65 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 68 ce the rolling h
0be0: 61 73 68 20 62 79 20 61 20 73 69 6e 67 6c 65 20 ash by a single
0bf0: 63 68 61 72 61 63 74 65 72 20 22 63 22 0a 2a 2f character "c".*/
0c00: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 61 73 .static void has
0c10: 68 5f 6e 65 78 74 28 68 61 73 68 20 2a 70 48 61 h_next(hash *pHa
0c20: 73 68 2c 20 69 6e 74 20 63 29 7b 0a 20 20 75 31 sh, int c){. u1
0c30: 36 20 6f 6c 64 20 3d 20 70 48 61 73 68 2d 3e 7a 6 old = pHash->z
0c40: 5b 70 48 61 73 68 2d 3e 69 5d 3b 0a 20 20 70 48 [pHash->i];. pH
0c50: 61 73 68 2d 3e 7a 5b 70 48 61 73 68 2d 3e 69 5d ash->z[pHash->i]
0c60: 20 3d 20 63 3b 0a 20 20 70 48 61 73 68 2d 3e 69 = c;. pHash->i
0c70: 20 3d 20 28 70 48 61 73 68 2d 3e 69 2b 31 29 26 = (pHash->i+1)&
0c80: 28 4e 48 41 53 48 2d 31 29 3b 0a 20 20 70 48 61 (NHASH-1);. pHa
0c90: 73 68 2d 3e 61 20 3d 20 70 48 61 73 68 2d 3e 61 sh->a = pHash->a
0ca0: 20 2d 20 6f 6c 64 20 2b 20 63 3b 0a 20 20 70 48 - old + c;. pH
0cb0: 61 73 68 2d 3e 62 20 3d 20 70 48 61 73 68 2d 3e ash->b = pHash->
0cc0: 62 20 2d 20 4e 48 41 53 48 2a 6f 6c 64 20 2b 20 b - NHASH*old +
0cd0: 70 48 61 73 68 2d 3e 61 3b 0a 7d 0a 0a 2f 2a 0a pHash->a;.}../*.
0ce0: 2a 2a 20 52 65 74 75 72 6e 20 61 20 33 32 2d 62 ** Return a 32-b
0cf0: 69 74 20 68 61 73 68 20 76 61 6c 75 65 0a 2a 2f it hash value.*/
0d00: 0a 73 74 61 74 69 63 20 75 33 32 20 68 61 73 68 .static u32 hash
0d10: 5f 33 32 62 69 74 28 68 61 73 68 20 2a 70 48 61 _32bit(hash *pHa
0d20: 73 68 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 70 sh){. return (p
0d30: 48 61 73 68 2d 3e 61 20 26 20 30 78 66 66 66 66 Hash->a & 0xffff
0d40: 29 20 7c 20 28 28 28 75 33 32 29 28 70 48 61 73 ) | (((u32)(pHas
0d50: 68 2d 3e 62 20 26 20 30 78 66 66 66 66 29 29 3c h->b & 0xffff))<
0d60: 3c 31 36 29 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 57 <16);.}../*.** W
0d70: 72 69 74 65 20 61 6e 20 62 61 73 65 2d 36 34 20 rite an base-64
0d80: 69 6e 74 65 67 65 72 20 69 6e 74 6f 20 74 68 65 integer into the
0d90: 20 67 69 76 65 6e 20 62 75 66 66 65 72 2e 0a 2a given buffer..*
0da0: 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 70 75 /.static void pu
0db0: 74 49 6e 74 28 75 6e 73 69 67 6e 65 64 20 69 6e tInt(unsigned in
0dc0: 74 20 76 2c 20 63 68 61 72 20 2a 2a 70 7a 29 7b t v, char **pz){
0dd0: 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 . static const
0de0: 63 68 61 72 20 7a 44 69 67 69 74 73 5b 5d 20 3d char zDigits[] =
0df0: 20 0a 20 20 20 20 22 30 31 32 33 34 35 36 37 38 . "012345678
0e00: 39 41 42 43 44 45 46 47 48 49 4a 4b 4c 4d 4e 4f 9ABCDEFGHIJKLMNO
0e10: 50 51 52 53 54 55 56 57 58 59 5a 5f 61 62 63 64 PQRSTUVWXYZ_abcd
0e20: 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 71 72 73 74 efghijklmnopqrst
0e30: 75 76 77 78 79 7a 7e 22 3b 0a 20 20 2f 2a 20 20 uvwxyz~";. /*
0e40: 31 32 33 34 35 36 37 38 39 20 31 32 33 34 35 36 123456789 123456
0e50: 37 38 39 20 31 32 33 34 35 36 37 38 39 20 31 32 789 123456789 12
0e60: 33 34 35 36 37 38 39 20 31 32 33 34 35 36 37 38 3456789 12345678
0e70: 39 20 31 32 33 34 35 36 37 38 39 20 31 32 33 20 9 123456789 123
0e80: 2a 2f 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 20 */. int i, j;.
0e90: 20 63 68 61 72 20 7a 42 75 66 5b 32 30 5d 3b 0a char zBuf[20];.
0ea0: 20 20 69 66 28 20 76 3d 3d 30 20 29 7b 0a 20 20 if( v==0 ){.
0eb0: 20 20 2a 28 2a 70 7a 29 2b 2b 20 3d 20 27 30 27 *(*pz)++ = '0'
0ec0: 3b 0a 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 ;. return;.
0ed0: 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 76 3e 30 }. for(i=0; v>0
0ee0: 3b 20 69 2b 2b 2c 20 76 3e 3e 3d 36 29 7b 0a 20 ; i++, v>>=6){.
0ef0: 20 20 20 7a 42 75 66 5b 69 5d 20 3d 20 7a 44 69 zBuf[i] = zDi
0f00: 67 69 74 73 5b 76 26 30 78 33 66 5d 3b 0a 20 20 gits[v&0x3f];.
0f10: 7d 0a 20 20 66 6f 72 28 6a 3d 69 2d 31 3b 20 6a }. for(j=i-1; j
0f20: 3e 3d 30 3b 20 6a 2d 2d 29 7b 0a 20 20 20 20 2a >=0; j--){. *
0f30: 28 2a 70 7a 29 2b 2b 20 3d 20 7a 42 75 66 5b 6a (*pz)++ = zBuf[j
0f40: 5d 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 ];. }.}../*.**
0f50: 52 65 61 64 20 62 79 74 65 73 20 66 72 6f 6d 20 Read bytes from
0f60: 2a 70 7a 20 61 6e 64 20 63 6f 6e 76 65 72 74 20 *pz and convert
0f70: 74 68 65 6d 20 69 6e 74 6f 20 61 20 70 6f 73 69 them into a posi
0f80: 74 69 76 65 20 69 6e 74 65 67 65 72 2e 20 20 57 tive integer. W
0f90: 68 65 6e 0a 2a 2a 20 66 69 6e 69 73 68 65 64 2c hen.** finished,
0fa0: 20 6c 65 61 76 65 20 2a 70 7a 20 70 6f 69 6e 74 leave *pz point
0fb0: 69 6e 67 20 74 6f 20 74 68 65 20 66 69 72 73 74 ing to the first
0fc0: 20 63 68 61 72 61 63 74 65 72 20 70 61 73 74 20 character past
0fd0: 74 68 65 20 65 6e 64 20 6f 66 0a 2a 2a 20 74 68 the end of.** th
0fe0: 65 20 69 6e 74 65 67 65 72 2e 20 20 54 68 65 20 e integer. The
0ff0: 2a 70 4c 65 6e 20 70 61 72 61 6d 65 74 65 72 20 *pLen parameter
1000: 68 6f 6c 64 73 20 74 68 65 20 6c 65 6e 67 74 68 holds the length
1010: 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a of the string.*
1020: 2a 20 69 6e 20 2a 70 7a 20 61 6e 64 20 69 73 20 * in *pz and is
1030: 64 65 63 72 65 6d 65 6e 74 65 64 20 6f 6e 63 65 decremented once
1040: 20 66 6f 72 20 65 61 63 68 20 63 68 61 72 61 63 for each charac
1050: 74 65 72 20 69 6e 20 74 68 65 20 69 6e 74 65 67 ter in the integ
1060: 65 72 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e er..*/.static un
1070: 73 69 67 6e 65 64 20 69 6e 74 20 67 65 74 49 6e signed int getIn
1080: 74 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 2a 70 t(const char **p
1090: 7a 2c 20 69 6e 74 20 2a 70 4c 65 6e 29 7b 0a 20 z, int *pLen){.
10a0: 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 73 69 static const si
10b0: 67 6e 65 64 20 63 68 61 72 20 7a 56 61 6c 75 65 gned char zValue
10c0: 5b 5d 20 3d 20 7b 0a 20 20 20 20 2d 31 2c 20 2d [] = {. -1, -
10d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
10e0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 1, -1, -1, -1,
10f0: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1100: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 -1, -1, -1,.
1110: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1120: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1130: 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d -1, -1, -1, -
1140: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1150: 31 2c 0a 20 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 1,. -1, -1, -
1160: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1170: 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 20 2d 31 2c 1, -1, -1, -1,
1180: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1190: 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 20 20 30 2c -1, -1,. 0,
11a0: 20 20 31 2c 20 20 32 2c 20 20 33 2c 20 20 34 2c 1, 2, 3, 4,
11b0: 20 20 35 2c 20 20 36 2c 20 20 37 2c 20 20 20 20 5, 6, 7,
11c0: 38 2c 20 20 39 2c 20 2d 31 2c 20 2d 31 2c 20 2d 8, 9, -1, -1, -
11d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 1, -1, -1, -1,.
11e0: 20 20 20 2d 31 2c 20 31 30 2c 20 31 31 2c 20 31 -1, 10, 11, 1
11f0: 32 2c 20 31 33 2c 20 31 34 2c 20 31 35 2c 20 31 2, 13, 14, 15, 1
1200: 36 2c 20 20 20 31 37 2c 20 31 38 2c 20 31 39 2c 6, 17, 18, 19,
1210: 20 32 30 2c 20 32 31 2c 20 32 32 2c 20 32 33 2c 20, 21, 22, 23,
1220: 20 32 34 2c 0a 20 20 20 20 32 35 2c 20 32 36 2c 24,. 25, 26,
1230: 20 32 37 2c 20 32 38 2c 20 32 39 2c 20 33 30 2c 27, 28, 29, 30,
1240: 20 33 31 2c 20 33 32 2c 20 20 20 33 33 2c 20 33 31, 32, 33, 3
1250: 34 2c 20 33 35 2c 20 2d 31 2c 20 2d 31 2c 20 2d 4, 35, -1, -1, -
1260: 31 2c 20 2d 31 2c 20 33 36 2c 0a 20 20 20 20 2d 1, -1, 36,. -
1270: 31 2c 20 33 37 2c 20 33 38 2c 20 33 39 2c 20 34 1, 37, 38, 39, 4
1280: 30 2c 20 34 31 2c 20 34 32 2c 20 34 33 2c 20 20 0, 41, 42, 43,
1290: 20 34 34 2c 20 34 35 2c 20 34 36 2c 20 34 37 2c 44, 45, 46, 47,
12a0: 20 34 38 2c 20 34 39 2c 20 35 30 2c 20 35 31 2c 48, 49, 50, 51,
12b0: 0a 20 20 20 20 35 32 2c 20 35 33 2c 20 35 34 2c . 52, 53, 54,
12c0: 20 35 35 2c 20 35 36 2c 20 35 37 2c 20 35 38 2c 55, 56, 57, 58,
12d0: 20 35 39 2c 20 20 20 36 30 2c 20 36 31 2c 20 36 59, 60, 61, 6
12e0: 32 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 36 2, -1, -1, -1, 6
12f0: 33 2c 20 2d 31 2c 0a 20 20 7d 3b 0a 20 20 75 6e 3, -1,. };. un
1300: 73 69 67 6e 65 64 20 69 6e 74 20 76 20 3d 20 30 signed int v = 0
1310: 3b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 75 6e 73 ;. int c;. uns
1320: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d 20 igned char *z =
1330: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29 (unsigned char*)
1340: 2a 70 7a 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 *pz;. unsigned
1350: 63 68 61 72 20 2a 7a 53 74 61 72 74 20 3d 20 7a char *zStart = z
1360: 3b 0a 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20 ;. while( (c =
1370: 7a 56 61 6c 75 65 5b 30 78 37 66 26 2a 28 7a 2b zValue[0x7f&*(z+
1380: 2b 29 5d 29 3e 3d 30 20 29 7b 0a 20 20 20 20 20 +)])>=0 ){.
1390: 76 20 3d 20 28 76 3c 3c 36 29 20 2b 20 63 3b 0a v = (v<<6) + c;.
13a0: 20 20 7d 0a 20 20 7a 2d 2d 3b 0a 20 20 2a 70 4c }. z--;. *pL
13b0: 65 6e 20 2d 3d 20 7a 20 2d 20 7a 53 74 61 72 74 en -= z - zStart
13c0: 3b 0a 20 20 2a 70 7a 20 3d 20 28 63 68 61 72 2a ;. *pz = (char*
13d0: 29 7a 3b 0a 20 20 72 65 74 75 72 6e 20 76 3b 0a )z;. return v;.
13e0: 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 75 72 6e 20 }../*.** Return
13f0: 74 68 65 20 6e 75 6d 62 65 72 20 64 69 67 69 74 the number digit
1400: 73 20 69 6e 20 74 68 65 20 62 61 73 65 2d 36 34 s in the base-64
1410: 20 72 65 70 72 65 73 65 6e 74 61 74 69 6f 6e 20 representation
1420: 6f 66 20 61 20 70 6f 73 69 74 69 76 65 20 69 6e of a positive in
1430: 74 65 67 65 72 0a 2a 2f 0a 73 74 61 74 69 63 20 teger.*/.static
1440: 69 6e 74 20 64 69 67 69 74 5f 63 6f 75 6e 74 28 int digit_count(
1450: 69 6e 74 20 76 29 7b 0a 20 20 75 6e 73 69 67 6e int v){. unsign
1460: 65 64 20 69 6e 74 20 69 2c 20 78 3b 0a 20 20 66 ed int i, x;. f
1470: 6f 72 28 69 3d 31 2c 20 78 3d 36 34 3b 20 76 3e or(i=1, x=64; v>
1480: 3d 78 3b 20 69 2b 2b 2c 20 78 20 3c 3c 3d 20 36 =x; i++, x <<= 6
1490: 29 7b 7d 0a 20 20 72 65 74 75 72 6e 20 69 3b 0a ){}. return i;.
14a0: 7d 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d 70 75 74 65 }../*.** Compute
14b0: 20 61 20 33 32 2d 62 69 74 20 63 68 65 63 6b 73 a 32-bit checks
14c0: 75 6d 20 6f 6e 20 74 68 65 20 4e 2d 62 79 74 65 um on the N-byte
14d0: 20 62 75 66 66 65 72 2e 20 20 52 65 74 75 72 6e buffer. Return
14e0: 20 74 68 65 20 72 65 73 75 6c 74 2e 0a 2a 2f 0a the result..*/.
14f0: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20 static unsigned
1500: 69 6e 74 20 63 68 65 63 6b 73 75 6d 28 63 6f 6e int checksum(con
1510: 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69 6e st char *zIn, in
1520: 74 20 4e 29 7b 0a 20 20 63 6f 6e 73 74 20 75 6e t N){. const un
1530: 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d signed char *z =
1540: 20 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64 (const unsigned
1550: 20 63 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 75 6e char*)zIn;. un
1560: 73 69 67 6e 65 64 20 69 6e 74 20 73 75 6d 20 3d signed int sum =
1570: 20 30 3b 0a 20 20 77 68 69 6c 65 28 20 4e 3e 3d 0;. while( N>=
1580: 34 20 29 7b 0a 20 20 20 20 73 75 6d 20 2b 3d 20 4 ){. sum +=
1590: 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c 20 28 7a 5b (z[0]<<24) | (z[
15a0: 31 5d 3c 3c 31 36 29 20 7c 20 28 7a 5b 32 5d 3c 1]<<16) | (z[2]<
15b0: 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a 20 20 20 20 <8) | z[3];.
15c0: 7a 20 2b 3d 20 34 3b 0a 20 20 20 20 4e 20 2d 3d z += 4;. N -=
15d0: 20 34 3b 0a 20 20 7d 0a 20 20 69 66 28 20 4e 3e 4;. }. if( N>
15e0: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 0 ){. unsigne
15f0: 64 20 63 68 61 72 20 7a 42 75 66 5b 34 5d 3b 0a d char zBuf[4];.
1600: 20 20 20 20 6d 65 6d 73 65 74 28 7a 42 75 66 2c memset(zBuf,
1610: 20 30 2c 20 73 69 7a 65 6f 66 28 7a 42 75 66 29 0, sizeof(zBuf)
1620: 29 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 42 );. memcpy(zB
1630: 75 66 2c 20 7a 2c 20 4e 29 3b 0a 20 20 20 20 7a uf, z, N);. z
1640: 20 3d 20 7a 42 75 66 3b 0a 20 20 20 20 73 75 6d = zBuf;. sum
1650: 20 2b 3d 20 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c += (z[0]<<24) |
1660: 20 28 7a 5b 31 5d 3c 3c 31 36 29 20 7c 20 28 7a (z[1]<<16) | (z
1670: 5b 32 5d 3c 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a [2]<<8) | z[3];.
1680: 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 73 75 6d }. return sum
1690: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 4d 61 78 69 6d ;.}../*.** Maxim
16a0: 75 6d 20 6e 75 6d 62 65 72 20 6f 66 20 6c 61 6e um number of lan
16b0: 64 6d 61 72 6b 73 20 74 6f 20 73 65 74 20 69 6e dmarks to set in
16c0: 20 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 the source file
16d0: 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4d 58 5f ..*/.#define MX_
16e0: 4c 41 4e 44 4d 41 52 4b 20 28 31 30 32 34 2a 31 LANDMARK (1024*1
16f0: 32 38 29 0a 0a 2f 2a 0a 2a 2a 20 43 72 65 61 74 28)../*.** Creat
1700: 65 20 61 20 6e 65 77 20 64 65 6c 74 61 2e 0a 2a e a new delta..*
1710: 2a 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 69 *.** The delta i
1720: 73 20 77 72 69 74 74 65 6e 20 69 6e 74 6f 20 61 s written into a
1730: 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 75 preallocated bu
1740: 66 66 65 72 2c 20 7a 44 65 6c 74 61 2c 20 77 68 ffer, zDelta, wh
1750: 69 63 68 20 0a 2a 2a 20 73 68 6f 75 6c 64 20 62 ich .** should b
1760: 65 20 61 74 20 6c 65 61 73 74 20 36 30 20 62 79 e at least 60 by
1770: 74 65 73 20 6c 6f 6e 67 65 72 20 74 68 61 6e 20 tes longer than
1780: 74 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 2c the target file,
1790: 20 7a 4f 75 74 2e 0a 2a 2a 20 54 68 65 20 64 65 zOut..** The de
17a0: 6c 74 61 20 73 74 72 69 6e 67 20 77 69 6c 6c 20 lta string will
17b0: 62 65 20 4e 55 4c 2d 74 65 72 6d 69 6e 61 74 65 be NUL-terminate
17c0: 64 2c 20 62 75 74 20 69 74 20 6d 69 67 68 74 20 d, but it might
17d0: 61 6c 73 6f 20 63 6f 6e 74 61 69 6e 0a 2a 2a 20 also contain.**
17e0: 65 6d 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61 embedded NUL cha
17f0: 72 61 63 74 65 72 73 20 69 66 20 65 69 74 68 65 racters if eithe
1800: 72 20 74 68 65 20 7a 53 72 63 20 6f 72 20 7a 4f r the zSrc or zO
1810: 75 74 20 66 69 6c 65 73 20 61 72 65 0a 2a 2a 20 ut files are.**
1820: 62 69 6e 61 72 79 2e 20 20 54 68 69 73 20 66 75 binary. This fu
1830: 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 20 74 nction returns t
1840: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65 he length of the
1850: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a 2a delta string.**
1860: 20 69 6e 20 62 79 74 65 73 2c 20 65 78 63 6c 75 in bytes, exclu
1870: 64 69 6e 67 20 74 68 65 20 66 69 6e 61 6c 20 4e ding the final N
1880: 55 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 UL terminator ch
1890: 61 72 61 63 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 4f aracter..**.** O
18a0: 75 74 70 75 74 20 46 6f 72 6d 61 74 3a 0a 2a 2a utput Format:.**
18b0: 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 62 65 .** The delta be
18c0: 67 69 6e 73 20 77 69 74 68 20 61 20 62 61 73 65 gins with a base
18d0: 36 34 20 6e 75 6d 62 65 72 20 66 6f 6c 6c 6f 77 64 number follow
18e0: 65 64 20 62 79 20 61 20 6e 65 77 6c 69 6e 65 2e ed by a newline.
18f0: 20 20 54 68 69 73 0a 2a 2a 20 6e 75 6d 62 65 72 This.** number
1900: 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 20 6f is the number o
1910: 66 20 62 79 74 65 73 20 69 6e 20 74 68 65 20 54 f bytes in the T
1920: 41 52 47 45 54 20 66 69 6c 65 2e 20 20 54 68 75 ARGET file. Thu
1930: 73 2c 20 67 69 76 65 6e 20 61 0a 2a 2a 20 64 65 s, given a.** de
1940: 6c 74 61 20 66 69 6c 65 20 7a 2c 20 61 20 70 72 lta file z, a pr
1950: 6f 67 72 61 6d 20 63 61 6e 20 63 6f 6d 70 75 74 ogram can comput
1960: 65 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 e the size of th
1970: 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a 2a e output file.**
1980: 20 73 69 6d 70 6c 79 20 62 79 20 72 65 61 64 69 simply by readi
1990: 6e 67 20 74 68 65 20 66 69 72 73 74 20 6c 69 6e ng the first lin
19a0: 65 20 61 6e 64 20 64 65 63 6f 64 69 6e 67 20 74 e and decoding t
19b0: 68 65 20 62 61 73 65 2d 36 34 20 6e 75 6d 62 65 he base-64 numbe
19c0: 72 0a 2a 2a 20 66 6f 75 6e 64 20 74 68 65 72 65 r.** found there
19d0: 2e 20 20 54 68 65 20 64 65 6c 74 61 5f 6f 75 74 . The delta_out
19e0: 70 75 74 5f 73 69 7a 65 28 29 20 72 6f 75 74 69 put_size() routi
19f0: 6e 65 20 64 6f 65 73 20 65 78 61 63 74 6c 79 20 ne does exactly
1a00: 74 68 69 73 2e 0a 2a 2a 0a 2a 2a 20 41 66 74 65 this..**.** Afte
1a10: 72 20 74 68 65 20 69 6e 69 74 69 61 6c 20 73 69 r the initial si
1a20: 7a 65 20 6e 75 6d 62 65 72 2c 20 74 68 65 20 64 ze number, the d
1a30: 65 6c 74 61 20 63 6f 6e 73 69 73 74 73 20 6f 66 elta consists of
1a40: 20 61 20 73 65 72 69 65 73 20 6f 66 0a 2a 2a 20 a series of.**
1a50: 6c 69 74 65 72 61 6c 20 74 65 78 74 20 73 65 67 literal text seg
1a60: 6d 65 6e 74 73 20 61 6e 64 20 63 6f 6d 6d 61 6e ments and comman
1a70: 64 73 20 74 6f 20 63 6f 70 79 20 66 72 6f 6d 20 ds to copy from
1a80: 74 68 65 20 53 4f 55 52 43 45 20 66 69 6c 65 2e the SOURCE file.
1a90: 20 20 0a 2a 2a 20 41 20 63 6f 70 79 20 63 6f 6d .** A copy com
1aa0: 6d 61 6e 64 20 6c 6f 6f 6b 73 20 6c 69 6b 65 20 mand looks like
1ab0: 74 68 69 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20 this:.**.**
1ac0: 4e 4e 4e 40 4d 4d 4d 2c 0a 2a 2a 0a 2a 2a 20 77 NNN@MMM,.**.** w
1ad0: 68 65 72 65 20 4e 4e 4e 20 69 73 20 74 68 65 20 here NNN is the
1ae0: 6e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73 20 number of bytes
1af0: 74 6f 20 62 65 20 63 6f 70 69 65 64 20 61 6e 64 to be copied and
1b00: 20 4d 4d 4d 20 69 73 20 74 68 65 20 6f 66 66 73 MMM is the offs
1b10: 65 74 0a 2a 2a 20 69 6e 74 6f 20 74 68 65 20 73 et.** into the s
1b20: 6f 75 72 63 65 20 66 69 6c 65 20 6f 66 20 74 68 ource file of th
1b30: 65 20 66 69 72 73 74 20 62 79 74 65 20 28 62 6f e first byte (bo
1b40: 74 68 20 62 61 73 65 2d 36 34 29 2e 20 20 20 49 th base-64). I
1b50: 66 20 4e 4e 4e 20 69 73 20 30 0a 2a 2a 20 69 74 f NNN is 0.** it
1b60: 20 6d 65 61 6e 73 20 63 6f 70 79 20 74 68 65 20 means copy the
1b70: 72 65 73 74 20 6f 66 20 74 68 65 20 69 6e 70 75 rest of the inpu
1b80: 74 20 66 69 6c 65 2e 20 20 4c 69 74 65 72 61 6c t file. Literal
1b90: 20 74 65 78 74 20 69 73 20 6c 69 6b 65 20 74 68 text is like th
1ba0: 69 73 3a 0a 2a 2a 0a 2a 2a 20 20 20 20 20 4e 4e is:.**.** NN
1bb0: 4e 3a 54 54 54 54 54 0a 2a 2a 0a 2a 2a 20 77 68 N:TTTTT.**.** wh
1bc0: 65 72 65 20 4e 4e 4e 20 69 73 20 74 68 65 20 6e ere NNN is the n
1bd0: 75 6d 62 65 72 20 6f 66 20 62 79 74 65 73 20 6f umber of bytes o
1be0: 66 20 74 65 78 74 20 28 62 61 73 65 2d 36 34 29 f text (base-64)
1bf0: 20 61 6e 64 20 54 54 54 54 54 20 69 73 20 74 68 and TTTTT is th
1c00: 65 20 74 65 78 74 2e 0a 2a 2a 0a 2a 2a 20 54 68 e text..**.** Th
1c10: 65 20 6c 61 73 74 20 74 65 72 6d 20 69 73 20 6f e last term is o
1c20: 66 20 74 68 65 20 66 6f 72 6d 0a 2a 2a 0a 2a 2a f the form.**.**
1c30: 20 20 20 20 20 4e 4e 4e 3b 0a 2a 2a 0a 2a 2a 20 NNN;.**.**
1c40: 49 6e 20 74 68 69 73 20 63 61 73 65 2c 20 4e 4e In this case, NN
1c50: 4e 20 69 73 20 61 20 33 32 2d 62 69 74 20 62 69 N is a 32-bit bi
1c60: 67 65 6e 64 69 61 6e 20 63 68 65 63 6b 73 75 6d gendian checksum
1c70: 20 6f 66 20 74 68 65 20 6f 75 74 70 75 74 20 66 of the output f
1c80: 69 6c 65 0a 2a 2a 20 74 68 61 74 20 63 61 6e 20 ile.** that can
1c90: 62 65 20 75 73 65 64 20 74 6f 20 76 65 72 69 66 be used to verif
1ca0: 79 20 74 68 61 74 20 74 68 65 20 64 65 6c 74 61 y that the delta
1cb0: 20 61 70 70 6c 69 65 64 20 63 6f 72 72 65 63 74 applied correct
1cc0: 6c 79 2e 20 20 41 6c 6c 0a 2a 2a 20 6e 75 6d 62 ly. All.** numb
1cd0: 65 72 73 20 61 72 65 20 69 6e 20 62 61 73 65 2d ers are in base-
1ce0: 36 34 2e 0a 2a 2a 0a 2a 2a 20 50 75 72 65 20 74 64..**.** Pure t
1cf0: 65 78 74 20 66 69 6c 65 73 20 67 65 6e 65 72 61 ext files genera
1d00: 74 65 20 61 20 70 75 72 65 20 74 65 78 74 20 64 te a pure text d
1d10: 65 6c 74 61 2e 20 20 42 69 6e 61 72 79 20 66 69 elta. Binary fi
1d20: 6c 65 73 20 67 65 6e 65 72 61 74 65 20 61 0a 2a les generate a.*
1d30: 2a 20 64 65 6c 74 61 20 74 68 61 74 20 6d 61 79 * delta that may
1d40: 20 63 6f 6e 74 61 69 6e 20 73 6f 6d 65 20 62 69 contain some bi
1d50: 6e 61 72 79 20 64 61 74 61 2e 0a 2a 2a 0a 2a 2a nary data..**.**
1d60: 20 41 6c 67 6f 72 69 74 68 6d 3a 0a 2a 2a 0a 2a Algorithm:.**.*
1d70: 2a 20 54 68 65 20 65 6e 63 6f 64 65 72 20 66 69 * The encoder fi
1d80: 72 73 74 20 62 75 69 6c 64 73 20 61 20 68 61 73 rst builds a has
1d90: 68 20 74 61 62 6c 65 20 74 6f 20 68 65 6c 70 20 h table to help
1da0: 69 74 20 66 69 6e 64 20 6d 61 74 63 68 69 6e 67 it find matching
1db0: 0a 2a 2a 20 70 61 74 74 65 72 6e 73 20 69 6e 20 .** patterns in
1dc0: 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 2e the source file.
1dd0: 20 20 31 36 2d 62 79 74 65 20 63 68 75 6e 6b 73 16-byte chunks
1de0: 20 6f 66 20 74 68 65 20 73 6f 75 72 63 65 20 66 of the source f
1df0: 69 6c 65 0a 2a 2a 20 73 61 6d 70 6c 65 64 20 61 ile.** sampled a
1e00: 74 20 65 76 65 6e 6c 79 20 73 70 61 63 65 64 20 t evenly spaced
1e10: 69 6e 74 65 72 76 61 6c 73 20 61 72 65 20 75 73 intervals are us
1e20: 65 64 20 74 6f 20 70 6f 70 75 6c 61 74 65 20 74 ed to populate t
1e30: 68 65 20 68 61 73 68 0a 2a 2a 20 74 61 62 6c 65 he hash.** table
1e40: 2e 0a 2a 2a 0a 2a 2a 20 4e 65 78 74 20 77 65 20 ..**.** Next we
1e50: 62 65 67 69 6e 20 73 63 61 6e 6e 69 6e 67 20 74 begin scanning t
1e60: 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 20 75 he target file u
1e70: 73 69 6e 67 20 61 20 73 6c 69 64 69 6e 67 20 31 sing a sliding 1
1e80: 36 2d 62 79 74 65 0a 2a 2a 20 77 69 6e 64 6f 77 6-byte.** window
1e90: 2e 20 20 54 68 65 20 68 61 73 68 20 6f 66 20 74 . The hash of t
1ea0: 68 65 20 31 36 2d 62 79 74 65 20 77 69 6e 64 6f he 16-byte windo
1eb0: 77 20 69 6e 20 74 68 65 20 74 61 72 67 65 74 20 w in the target
1ec0: 69 73 20 75 73 65 64 20 74 6f 0a 2a 2a 20 73 65 is used to.** se
1ed0: 61 72 63 68 20 66 6f 72 20 61 20 6d 61 74 63 68 arch for a match
1ee0: 69 6e 67 20 73 65 63 74 69 6f 6e 20 69 6e 20 74 ing section in t
1ef0: 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 2e 20 he source file.
1f00: 20 57 68 65 6e 20 61 20 6d 61 74 63 68 0a 2a 2a When a match.**
1f10: 20 69 73 20 66 6f 75 6e 64 2c 20 61 20 63 6f 70 is found, a cop
1f20: 79 20 63 6f 6d 6d 61 6e 64 20 69 73 20 61 64 64 y command is add
1f30: 65 64 20 74 6f 20 74 68 65 20 64 65 6c 74 61 2e ed to the delta.
1f40: 20 20 41 6e 20 65 66 66 6f 72 74 20 69 73 0a 2a An effort is.*
1f50: 2a 20 6d 61 64 65 20 74 6f 20 65 78 74 65 6e 64 * made to extend
1f60: 20 74 68 65 20 6d 61 74 63 68 69 6e 67 20 73 65 the matching se
1f70: 63 74 69 6f 6e 20 74 6f 20 72 65 67 69 6f 6e 73 ction to regions
1f80: 20 74 68 61 74 20 63 6f 6d 65 20 62 65 66 6f 72 that come befor
1f90: 65 0a 2a 2a 20 61 6e 64 20 61 66 74 65 72 20 74 e.** and after t
1fa0: 68 65 20 31 36 2d 62 79 74 65 20 68 61 73 68 20 he 16-byte hash
1fb0: 77 69 6e 64 6f 77 2e 20 20 41 20 63 6f 70 79 20 window. A copy
1fc0: 63 6f 6d 6d 61 6e 64 20 69 73 20 6f 6e 6c 79 20 command is only
1fd0: 69 73 73 75 65 64 0a 2a 2a 20 69 66 20 74 68 65 issued.** if the
1fe0: 20 72 65 73 75 6c 74 20 77 6f 75 6c 64 20 75 73 result would us
1ff0: 65 20 6c 65 73 73 20 73 70 61 63 65 20 74 68 61 e less space tha
2000: 74 20 6a 75 73 74 20 71 75 6f 74 69 6e 67 20 74 t just quoting t
2010: 68 65 20 74 65 78 74 0a 2a 2a 20 6c 69 74 65 72 he text.** liter
2020: 61 6c 6c 79 2e 20 4c 69 74 65 72 61 6c 20 74 65 ally. Literal te
2030: 78 74 20 69 73 20 61 64 64 65 64 20 74 6f 20 74 xt is added to t
2040: 68 65 20 64 65 6c 74 61 20 66 6f 72 20 73 65 63 he delta for sec
2050: 74 69 6f 6e 73 20 74 68 61 74 20 0a 2a 2a 20 64 tions that .** d
2060: 6f 20 6e 6f 74 20 6d 61 74 63 68 20 6f 72 20 77 o not match or w
2070: 68 69 63 68 20 63 61 6e 20 6e 6f 74 20 62 65 20 hich can not be
2080: 65 6e 63 6f 64 65 64 20 65 66 66 69 63 69 65 6e encoded efficien
2090: 74 6c 79 20 75 73 69 6e 67 20 63 6f 70 79 0a 2a tly using copy.*
20a0: 2a 20 63 6f 6d 6d 61 6e 64 73 2e 0a 2a 2f 0a 69 * commands..*/.i
20b0: 6e 74 20 64 65 6c 74 61 5f 63 72 65 61 74 65 28 nt delta_create(
20c0: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a . const char *z
20d0: 53 72 63 2c 20 20 20 20 20 20 2f 2a 20 54 68 65 Src, /* The
20e0: 20 73 6f 75 72 63 65 20 6f 72 20 70 61 74 74 65 source or patte
20f0: 72 6e 20 66 69 6c 65 20 2a 2f 0a 20 20 75 6e 73 rn file */. uns
2100: 69 67 6e 65 64 20 69 6e 74 20 6c 65 6e 53 72 63 igned int lenSrc
2110: 2c 20 20 20 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 , /* Length of
2120: 20 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 the source file
2130: 20 2a 2f 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 */. const char
2140: 20 2a 7a 4f 75 74 2c 20 20 20 20 20 20 2f 2a 20 *zOut, /*
2150: 54 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 20 The target file
2160: 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e */. unsigned in
2170: 74 20 6c 65 6e 4f 75 74 2c 20 20 20 2f 2a 20 4c t lenOut, /* L
2180: 65 6e 67 74 68 20 6f 66 20 74 68 65 20 74 61 72 ength of the tar
2190: 67 65 74 20 66 69 6c 65 20 2a 2f 0a 20 20 63 68 get file */. ch
21a0: 61 72 20 2a 7a 44 65 6c 74 61 20 20 20 20 20 20 ar *zDelta
21b0: 20 20 20 20 20 2f 2a 20 57 72 69 74 65 20 74 68 /* Write th
21c0: 65 20 64 65 6c 74 61 20 69 6e 74 6f 20 74 68 69 e delta into thi
21d0: 73 20 62 75 66 66 65 72 20 2a 2f 0a 29 7b 0a 20 s buffer */.){.
21e0: 20 69 6e 74 20 69 2c 20 62 61 73 65 3b 0a 20 20 int i, base;.
21f0: 63 68 61 72 20 2a 7a 4f 72 69 67 44 65 6c 74 61 char *zOrigDelta
2200: 20 3d 20 7a 44 65 6c 74 61 3b 0a 20 20 68 61 73 = zDelta;. has
2210: 68 20 68 3b 0a 20 20 69 6e 74 20 2a 63 6f 6c 6c h h;. int *coll
2220: 69 64 65 3b 0a 20 20 69 6e 74 20 6c 61 73 74 52 ide;. int lastR
2230: 65 61 64 20 3d 20 2d 31 3b 20 20 20 20 20 20 20 ead = -1;
2240: 20 20 2f 2a 20 4c 61 73 74 20 62 79 74 65 20 6f /* Last byte o
2250: 66 20 7a 53 72 63 20 72 65 61 64 20 62 79 20 61 f zSrc read by a
2260: 20 43 4f 50 59 20 63 6f 6d 6d 61 6e 64 20 2a 2f COPY command */
2270: 0a 20 20 69 6e 74 20 6c 61 6e 64 6d 61 72 6b 5b . int landmark[
2280: 4d 58 5f 4c 41 4e 44 4d 41 52 4b 5d 3b 0a 0a 20 MX_LANDMARK];..
2290: 20 2f 2a 20 41 64 64 20 74 68 65 20 74 61 72 67 /* Add the targ
22a0: 65 74 20 66 69 6c 65 20 73 69 7a 65 20 74 6f 20 et file size to
22b0: 74 68 65 20 62 65 67 69 6e 6e 69 6e 67 20 6f 66 the beginning of
22c0: 20 74 68 65 20 64 65 6c 74 61 0a 20 20 2a 2f 0a the delta. */.
22d0: 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f 75 74 2c putInt(lenOut,
22e0: 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 2a 28 7a &zDelta);. *(z
22f0: 44 65 6c 74 61 2b 2b 29 20 3d 20 27 5c 6e 27 3b Delta++) = '\n';
2300: 0a 0a 20 20 2f 2a 20 49 66 20 74 68 65 20 73 6f .. /* If the so
2310: 75 72 63 65 20 66 69 6c 65 20 69 73 20 76 65 72 urce file is ver
2320: 79 20 73 6d 61 6c 6c 2c 20 69 74 20 6d 65 61 6e y small, it mean
2330: 73 20 74 68 61 74 20 77 65 20 68 61 76 65 20 6e s that we have n
2340: 6f 0a 20 20 2a 2a 20 63 68 61 6e 63 65 20 6f 66 o. ** chance of
2350: 20 65 76 65 72 20 64 6f 69 6e 67 20 61 20 63 6f ever doing a co
2360: 70 79 20 63 6f 6d 6d 61 6e 64 2e 20 20 4a 75 73 py command. Jus
2370: 74 20 6f 75 74 70 75 74 20 61 20 73 69 6e 67 6c t output a singl
2380: 65 0a 20 20 2a 2a 20 6c 69 74 65 72 61 6c 20 73 e. ** literal s
2390: 65 67 6d 65 6e 74 20 66 6f 72 20 74 68 65 20 65 egment for the e
23a0: 6e 74 69 72 65 20 74 61 72 67 65 74 20 61 6e 64 ntire target and
23b0: 20 65 78 69 74 2e 0a 20 20 2a 2f 0a 20 20 69 66 exit.. */. if
23c0: 28 20 6c 65 6e 53 72 63 3c 3d 4e 48 41 53 48 20 ( lenSrc<=NHASH
23d0: 29 7b 0a 20 20 20 20 70 75 74 49 6e 74 28 6c 65 ){. putInt(le
23e0: 6e 4f 75 74 2c 20 26 7a 44 65 6c 74 61 29 3b 0a nOut, &zDelta);.
23f0: 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 *(zDelta++)
2400: 3d 20 27 3a 27 3b 0a 20 20 20 20 6d 65 6d 63 70 = ':';. memcp
2410: 79 28 7a 44 65 6c 74 61 2c 20 7a 4f 75 74 2c 20 y(zDelta, zOut,
2420: 6c 65 6e 4f 75 74 29 3b 0a 20 20 20 20 7a 44 65 lenOut);. zDe
2430: 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 3b 0a 20 lta += lenOut;.
2440: 20 20 20 70 75 74 49 6e 74 28 63 68 65 63 6b 73 putInt(checks
2450: 75 6d 28 7a 4f 75 74 2c 20 6c 65 6e 4f 75 74 29 um(zOut, lenOut)
2460: 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 , &zDelta);.
2470: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3b *(zDelta++) = ';
2480: 27 3b 0a 20 20 20 20 72 65 74 75 72 6e 20 7a 44 ';. return zD
2490: 65 6c 74 61 20 2d 20 7a 4f 72 69 67 44 65 6c 74 elta - zOrigDelt
24a0: 61 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 43 6f 6d a;. }.. /* Com
24b0: 70 75 74 65 20 74 68 65 20 68 61 73 68 20 74 61 pute the hash ta
24c0: 62 6c 65 20 75 73 65 64 20 74 6f 20 6c 6f 63 61 ble used to loca
24d0: 74 65 20 6d 61 74 63 68 69 6e 67 20 73 65 63 74 te matching sect
24e0: 69 6f 6e 73 20 69 6e 20 74 68 65 0a 20 20 2a 2a ions in the. **
24f0: 20 73 6f 75 72 63 65 20 66 69 6c 65 2e 0a 20 20 source file..
2500: 2a 2f 0a 20 20 63 6f 6c 6c 69 64 65 20 3d 20 6d */. collide = m
2510: 61 6c 6c 6f 63 28 20 6c 65 6e 53 72 63 2a 73 69 alloc( lenSrc*si
2520: 7a 65 6f 66 28 69 6e 74 29 2f 4e 48 41 53 48 20 zeof(int)/NHASH
2530: 29 3b 0a 20 20 69 66 28 20 63 6f 6c 6c 69 64 65 );. if( collide
2540: 3d 3d 30 20 29 20 72 65 74 75 72 6e 20 2d 31 3b ==0 ) return -1;
2550: 0a 20 20 6d 65 6d 73 65 74 28 6c 61 6e 64 6d 61 . memset(landma
2560: 72 6b 2c 20 2d 31 2c 20 73 69 7a 65 6f 66 28 6c rk, -1, sizeof(l
2570: 61 6e 64 6d 61 72 6b 29 29 3b 0a 20 20 6d 65 6d andmark));. mem
2580: 73 65 74 28 63 6f 6c 6c 69 64 65 2c 20 2d 31 2c set(collide, -1,
2590: 20 6c 65 6e 53 72 63 2a 73 69 7a 65 6f 66 28 69 lenSrc*sizeof(i
25a0: 6e 74 29 2f 4e 48 41 53 48 20 29 3b 0a 20 20 66 nt)/NHASH );. f
25b0: 6f 72 28 69 3d 30 3b 20 69 3c 6c 65 6e 53 72 63 or(i=0; i<lenSrc
25c0: 2d 4e 48 41 53 48 3b 20 69 2b 3d 4e 48 41 53 48 -NHASH; i+=NHASH
25d0: 29 7b 0a 20 20 20 20 69 6e 74 20 68 76 3b 0a 20 ){. int hv;.
25e0: 20 20 20 68 61 73 68 5f 69 6e 69 74 28 26 68 2c hash_init(&h,
25f0: 20 26 7a 53 72 63 5b 69 5d 29 3b 0a 20 20 20 20 &zSrc[i]);.
2600: 68 76 20 3d 20 68 61 73 68 5f 33 32 62 69 74 28 hv = hash_32bit(
2610: 26 68 29 20 26 20 28 4d 58 5f 4c 41 4e 44 4d 41 &h) & (MX_LANDMA
2620: 52 4b 2d 31 29 3b 0a 20 20 20 20 63 6f 6c 6c 69 RK-1);. colli
2630: 64 65 5b 69 2f 4e 48 41 53 48 5d 20 3d 20 6c 61 de[i/NHASH] = la
2640: 6e 64 6d 61 72 6b 5b 68 76 5d 3b 0a 20 20 20 20 ndmark[hv];.
2650: 6c 61 6e 64 6d 61 72 6b 5b 68 76 5d 20 3d 20 69 landmark[hv] = i
2660: 2f 4e 48 41 53 48 3b 0a 20 20 7d 0a 0a 20 20 2f /NHASH;. }.. /
2670: 2a 20 42 65 67 69 6e 20 73 63 61 6e 6e 69 6e 67 * Begin scanning
2680: 20 74 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 the target file
2690: 20 61 6e 64 20 67 65 6e 65 72 61 74 69 6e 67 20 and generating
26a0: 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 73 20 61 6e copy commands an
26b0: 64 0a 20 20 2a 2a 20 6c 69 74 65 72 61 6c 20 73 d. ** literal s
26c0: 65 63 74 69 6f 6e 73 20 6f 66 20 74 68 65 20 64 ections of the d
26d0: 65 6c 74 61 2e 0a 20 20 2a 2f 0a 20 20 62 61 73 elta.. */. bas
26e0: 65 20 3d 20 30 3b 20 20 20 20 2f 2a 20 57 65 20 e = 0; /* We
26f0: 68 61 76 65 20 61 6c 72 65 61 64 79 20 67 65 6e have already gen
2700: 65 72 61 74 65 64 20 65 76 65 72 79 74 68 69 6e erated everythin
2710: 67 20 62 65 66 6f 72 65 20 7a 4f 75 74 5b 62 61 g before zOut[ba
2720: 73 65 5d 20 2a 2f 0a 20 20 77 68 69 6c 65 28 20 se] */. while(
2730: 62 61 73 65 2b 4e 48 41 53 48 3c 6c 65 6e 4f 75 base+NHASH<lenOu
2740: 74 20 29 7b 0a 20 20 20 20 69 6e 74 20 69 53 72 t ){. int iSr
2750: 63 2c 20 69 42 6c 6f 63 6b 3b 0a 20 20 20 20 75 c, iBlock;. u
2760: 6e 73 69 67 6e 65 64 20 69 6e 74 20 62 65 73 74 nsigned int best
2770: 43 6e 74 2c 20 62 65 73 74 4f 66 73 74 2c 20 62 Cnt, bestOfst, b
2780: 65 73 74 4c 69 74 73 7a 3b 0a 20 20 20 20 68 61 estLitsz;. ha
2790: 73 68 5f 69 6e 69 74 28 26 68 2c 20 26 7a 4f 75 sh_init(&h, &zOu
27a0: 74 5b 62 61 73 65 5d 29 3b 0a 20 20 20 20 69 20 t[base]);. i
27b0: 3d 20 30 3b 20 20 20 20 20 2f 2a 20 54 72 79 69 = 0; /* Tryi
27c0: 6e 67 20 74 6f 20 6d 61 74 63 68 20 61 20 6c 61 ng to match a la
27d0: 6e 64 6d 61 72 6b 20 61 67 61 69 6e 73 74 20 7a ndmark against z
27e0: 4f 75 74 5b 62 61 73 65 2b 69 5d 20 2a 2f 0a 20 Out[base+i] */.
27f0: 20 20 20 62 65 73 74 43 6e 74 20 3d 20 30 3b 0a bestCnt = 0;.
2800: 20 20 20 20 77 68 69 6c 65 28 20 31 20 29 7b 0a while( 1 ){.
2810: 20 20 20 20 20 20 69 6e 74 20 68 76 3b 0a 20 20 int hv;.
2820: 20 20 20 20 69 6e 74 20 6c 69 6d 69 74 20 3d 20 int limit =
2830: 35 30 3b 0a 0a 20 20 20 20 20 20 68 76 20 3d 20 50;.. hv =
2840: 68 61 73 68 5f 33 32 62 69 74 28 26 68 29 20 26 hash_32bit(&h) &
2850: 20 28 4d 58 5f 4c 41 4e 44 4d 41 52 4b 2d 31 29 (MX_LANDMARK-1)
2860: 3b 0a 20 20 20 20 20 20 44 45 42 55 47 32 28 20 ;. DEBUG2(
2870: 70 72 69 6e 74 66 28 22 4c 4f 4f 4b 49 4e 47 3a printf("LOOKING:
2880: 20 25 34 64 20 5b 25 73 5d 5c 6e 22 2c 20 62 61 %4d [%s]\n", ba
2890: 73 65 2b 69 2c 20 70 72 69 6e 74 31 36 28 26 7a se+i, print16(&z
28a0: 4f 75 74 5b 62 61 73 65 2b 69 5d 29 29 3b 20 29 Out[base+i])); )
28b0: 0a 20 20 20 20 20 20 69 42 6c 6f 63 6b 20 3d 20 . iBlock =
28c0: 6c 61 6e 64 6d 61 72 6b 5b 68 76 5d 3b 0a 20 20 landmark[hv];.
28d0: 20 20 20 20 77 68 69 6c 65 28 20 69 42 6c 6f 63 while( iBloc
28e0: 6b 3e 3d 30 20 26 26 20 28 6c 69 6d 69 74 2d 2d k>=0 && (limit--
28f0: 29 3e 30 20 29 7b 0a 20 20 20 20 20 20 20 20 2f )>0 ){. /
2900: 2a 0a 20 20 20 20 20 20 20 20 2a 2a 20 54 68 65 *. ** The
2910: 20 68 61 73 68 20 77 69 6e 64 6f 77 20 68 61 73 hash window has
2920: 20 69 64 65 6e 74 69 66 69 65 64 20 61 20 70 6f identified a po
2930: 74 65 6e 74 69 61 6c 20 6d 61 74 63 68 20 61 67 tential match ag
2940: 61 69 6e 73 74 20 0a 20 20 20 20 20 20 20 20 2a ainst . *
2950: 2a 20 6c 61 6e 64 6d 61 72 6b 20 62 6c 6f 63 6b * landmark block
2960: 20 69 42 6c 6f 63 6b 2e 20 20 42 75 74 20 77 65 iBlock. But we
2970: 20 6e 65 65 64 20 74 6f 20 69 6e 76 65 73 74 69 need to investi
2980: 67 61 74 65 20 66 75 72 74 68 65 72 2e 0a 20 20 gate further..
2990: 20 20 20 20 20 20 2a 2a 20 0a 20 20 20 20 20 20 ** .
29a0: 20 20 2a 2a 20 4c 6f 6f 6b 20 66 6f 72 20 61 20 ** Look for a
29b0: 72 65 67 69 6f 6e 20 69 6e 20 7a 4f 75 74 20 74 region in zOut t
29c0: 68 61 74 20 6d 61 74 63 68 65 73 20 7a 53 72 63 hat matches zSrc
29d0: 2e 20 41 6e 63 68 6f 72 20 74 68 65 20 73 65 61 . Anchor the sea
29e0: 72 63 68 0a 20 20 20 20 20 20 20 20 2a 2a 20 61 rch. ** a
29f0: 74 20 7a 53 72 63 5b 69 53 72 63 5d 20 61 6e 64 t zSrc[iSrc] and
2a00: 20 7a 4f 75 74 5b 62 61 73 65 2b 69 5d 2e 20 20 zOut[base+i].
2a10: 44 6f 20 6e 6f 74 20 69 6e 63 6c 75 64 65 20 61 Do not include a
2a20: 6e 79 74 68 69 6e 67 20 70 72 69 6f 72 20 74 6f nything prior to
2a30: 0a 20 20 20 20 20 20 20 20 2a 2a 20 7a 4f 75 74 . ** zOut
2a40: 5b 62 61 73 65 5d 20 6f 72 20 61 66 74 65 72 20 [base] or after
2a50: 7a 4f 75 74 5b 6f 75 74 4c 65 6e 5d 20 6e 6f 72 zOut[outLen] nor
2a60: 20 61 6e 79 74 68 69 6e 67 20 61 66 74 65 72 20 anything after
2a70: 7a 53 72 63 5b 73 72 63 4c 65 6e 5d 2e 0a 20 20 zSrc[srcLen]..
2a80: 20 20 20 20 20 20 2a 2a 0a 20 20 20 20 20 20 20 **.
2a90: 20 2a 2a 20 53 65 74 20 63 6e 74 20 65 71 75 61 ** Set cnt equa
2aa0: 6c 20 74 6f 20 74 68 65 20 6c 65 6e 67 74 68 20 l to the length
2ab0: 6f 66 20 74 68 65 20 6d 61 74 63 68 20 61 6e 64 of the match and
2ac0: 20 73 65 74 20 6f 66 73 74 20 73 6f 20 74 68 61 set ofst so tha
2ad0: 74 0a 20 20 20 20 20 20 20 20 2a 2a 20 7a 53 72 t. ** zSr
2ae0: 63 5b 6f 66 73 74 5d 20 69 73 20 74 68 65 20 66 c[ofst] is the f
2af0: 69 72 73 74 20 65 6c 65 6d 65 6e 74 20 6f 66 20 irst element of
2b00: 74 68 65 20 6d 61 74 63 68 2e 20 20 6c 69 74 73 the match. lits
2b10: 7a 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 0a z is the number.
2b20: 20 20 20 20 20 20 20 20 2a 2a 20 6f 66 20 63 68 ** of ch
2b30: 61 72 61 63 74 65 72 73 20 62 65 74 77 65 65 6e aracters between
2b40: 20 7a 4f 75 74 5b 62 61 73 65 5d 20 61 6e 64 20 zOut[base] and
2b50: 74 68 65 20 62 65 67 69 6e 6e 69 6e 67 20 6f 66 the beginning of
2b60: 20 74 68 65 20 6d 61 74 63 68 2e 0a 20 20 20 20 the match..
2b70: 20 20 20 20 2a 2a 20 73 7a 20 77 69 6c 6c 20 62 ** sz will b
2b80: 65 20 74 68 65 20 6f 76 65 72 68 65 61 64 20 28 e the overhead (
2b90: 69 6e 20 62 79 74 65 73 29 20 6e 65 65 64 65 64 in bytes) needed
2ba0: 20 74 6f 20 65 6e 63 6f 64 65 20 74 68 65 20 63 to encode the c
2bb0: 6f 70 79 0a 20 20 20 20 20 20 20 20 2a 2a 20 63 opy. ** c
2bc0: 6f 6d 6d 61 6e 64 2e 20 20 4f 6e 6c 79 20 67 65 ommand. Only ge
2bd0: 6e 65 72 61 74 65 20 63 6f 70 79 20 63 6f 6d 6d nerate copy comm
2be0: 61 6e 64 20 69 66 20 74 68 65 20 6f 76 65 72 68 and if the overh
2bf0: 65 61 64 20 6f 66 20 74 68 65 0a 20 20 20 20 20 ead of the.
2c00: 20 20 20 2a 2a 20 63 6f 70 79 20 63 6f 6d 6d 61 ** copy comma
2c10: 6e 64 20 69 73 20 6c 65 73 73 20 74 68 61 6e 20 nd is less than
2c20: 74 68 65 20 61 6d 6f 75 6e 74 20 6f 66 20 6c 69 the amount of li
2c30: 74 65 72 61 6c 20 74 65 78 74 20 74 6f 20 62 65 teral text to be
2c40: 20 63 6f 70 69 65 64 2e 0a 20 20 20 20 20 20 20 copied..
2c50: 20 2a 2f 0a 20 20 20 20 20 20 20 20 69 6e 74 20 */. int
2c60: 63 6e 74 2c 20 6f 66 73 74 2c 20 6c 69 74 73 7a cnt, ofst, litsz
2c70: 3b 0a 20 20 20 20 20 20 20 20 69 6e 74 20 6a 2c ;. int j,
2c80: 20 6b 2c 20 78 2c 20 79 3b 0a 20 20 20 20 20 20 k, x, y;.
2c90: 20 20 69 6e 74 20 73 7a 3b 0a 0a 20 20 20 20 20 int sz;..
2ca0: 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67 20 /* Beginning
2cb0: 61 74 20 69 53 72 63 2c 20 6d 61 74 63 68 20 66 at iSrc, match f
2cc0: 6f 72 77 61 72 64 73 20 61 73 20 66 61 72 20 61 orwards as far a
2cd0: 73 20 77 65 20 63 61 6e 2e 20 20 6a 20 63 6f 75 s we can. j cou
2ce0: 6e 74 73 0a 20 20 20 20 20 20 20 20 2a 2a 20 74 nts. ** t
2cf0: 68 65 20 6e 75 6d 62 65 72 20 6f 66 20 63 68 61 he number of cha
2d00: 72 61 63 74 65 72 73 20 74 68 61 74 20 6d 61 74 racters that mat
2d10: 63 68 20 2a 2f 0a 20 20 20 20 20 20 20 20 69 53 ch */. iS
2d20: 72 63 20 3d 20 69 42 6c 6f 63 6b 2a 4e 48 41 53 rc = iBlock*NHAS
2d30: 48 3b 0a 20 20 20 20 20 20 20 20 66 6f 72 28 6a H;. for(j
2d40: 3d 30 2c 20 78 3d 69 53 72 63 2c 20 79 3d 62 61 =0, x=iSrc, y=ba
2d50: 73 65 2b 69 3b 20 78 3c 6c 65 6e 53 72 63 20 26 se+i; x<lenSrc &
2d60: 26 20 79 3c 6c 65 6e 4f 75 74 3b 20 6a 2b 2b 2c & y<lenOut; j++,
2d70: 20 78 2b 2b 2c 20 79 2b 2b 29 7b 0a 20 20 20 20 x++, y++){.
2d80: 20 20 20 20 20 20 69 66 28 20 7a 53 72 63 5b 78 if( zSrc[x
2d90: 5d 21 3d 7a 4f 75 74 5b 79 5d 20 29 20 62 72 65 ]!=zOut[y] ) bre
2da0: 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 ak;. }.
2db0: 20 20 20 20 20 20 6a 2d 2d 3b 0a 0a 20 20 20 20 j--;..
2dc0: 20 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67 /* Beginning
2dd0: 20 61 74 20 69 53 72 63 2d 31 2c 20 6d 61 74 63 at iSrc-1, matc
2de0: 68 20 62 61 63 6b 77 61 72 64 73 20 61 73 20 66 h backwards as f
2df0: 61 72 20 61 73 20 77 65 20 63 61 6e 2e 20 20 6b ar as we can. k
2e00: 20 63 6f 75 6e 74 73 0a 20 20 20 20 20 20 20 20 counts.
2e10: 2a 2a 20 74 68 65 20 6e 75 6d 62 65 72 20 6f 66 ** the number of
2e20: 20 63 68 61 72 61 63 74 65 72 73 20 74 68 61 74 characters that
2e30: 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20 20 20 match */.
2e40: 20 20 66 6f 72 28 6b 3d 31 3b 20 6b 3c 69 53 72 for(k=1; k<iSr
2e50: 63 20 26 26 20 6b 3c 3d 69 3b 20 6b 2b 2b 29 7b c && k<=i; k++){
2e60: 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20 7a . if( z
2e70: 53 72 63 5b 69 53 72 63 2d 6b 5d 21 3d 7a 4f 75 Src[iSrc-k]!=zOu
2e80: 74 5b 62 61 73 65 2b 69 2d 6b 5d 20 29 20 62 72 t[base+i-k] ) br
2e90: 65 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 eak;. }.
2ea0: 20 20 20 20 20 20 20 6b 2d 2d 3b 0a 0a 20 20 20 k--;..
2eb0: 20 20 20 20 20 2f 2a 20 43 6f 6d 70 75 74 65 20 /* Compute
2ec0: 74 68 65 20 6f 66 66 73 65 74 20 61 6e 64 20 73 the offset and s
2ed0: 69 7a 65 20 6f 66 20 74 68 65 20 6d 61 74 63 68 ize of the match
2ee0: 69 6e 67 20 72 65 67 69 6f 6e 20 2a 2f 0a 20 20 ing region */.
2ef0: 20 20 20 20 20 20 6f 66 73 74 20 3d 20 69 53 72 ofst = iSr
2f00: 63 2d 6b 3b 0a 20 20 20 20 20 20 20 20 63 6e 74 c-k;. cnt
2f10: 20 3d 20 6a 2b 6b 2b 31 3b 0a 20 20 20 20 20 20 = j+k+1;.
2f20: 20 20 6c 69 74 73 7a 20 3d 20 69 2d 6b 3b 20 20 litsz = i-k;
2f30: 2f 2a 20 4e 75 6d 62 65 72 20 6f 66 20 62 79 74 /* Number of byt
2f40: 65 73 20 6f 66 20 6c 69 74 65 72 61 6c 20 74 65 es of literal te
2f50: 78 74 20 62 65 66 6f 72 65 20 74 68 65 20 63 6f xt before the co
2f60: 70 79 20 2a 2f 0a 20 20 20 20 20 20 20 20 44 45 py */. DE
2f70: 42 55 47 32 28 20 70 72 69 6e 74 66 28 22 4d 41 BUG2( printf("MA
2f80: 54 43 48 20 25 64 20 62 79 74 65 73 20 61 74 20 TCH %d bytes at
2f90: 25 64 3a 20 5b 25 73 5d 20 6c 69 74 73 7a 3d 25 %d: [%s] litsz=%
2fa0: 64 5c 6e 22 2c 0a 20 20 20 20 20 20 20 20 20 20 d\n",.
2fb0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 63 6e cn
2fc0: 74 2c 20 6f 66 73 74 2c 20 70 72 69 6e 74 31 36 t, ofst, print16
2fd0: 28 26 7a 53 72 63 5b 6f 66 73 74 5d 29 2c 20 6c (&zSrc[ofst]), l
2fe0: 69 74 73 7a 29 3b 20 29 0a 20 20 20 20 20 20 20 itsz); ).
2ff0: 20 2f 2a 20 73 7a 20 77 69 6c 6c 20 68 6f 6c 64 /* sz will hold
3000: 20 74 68 65 20 6e 75 6d 62 65 72 20 6f 66 20 62 the number of b
3010: 79 74 65 73 20 6e 65 65 64 65 64 20 74 6f 20 65 ytes needed to e
3020: 6e 63 6f 64 65 20 74 68 65 20 22 69 6e 73 65 72 ncode the "inser
3030: 74 22 0a 20 20 20 20 20 20 20 20 2a 2a 20 63 6f t". ** co
3040: 6d 6d 61 6e 64 20 61 6e 64 20 74 68 65 20 63 6f mmand and the co
3050: 70 79 20 63 6f 6d 6d 61 6e 64 2c 20 6e 6f 74 20 py command, not
3060: 63 6f 75 6e 74 69 6e 67 20 74 68 65 20 22 69 6e counting the "in
3070: 73 65 72 74 22 20 74 65 78 74 20 2a 2f 0a 20 20 sert" text */.
3080: 20 20 20 20 20 20 73 7a 20 3d 20 64 69 67 69 74 sz = digit
3090: 5f 63 6f 75 6e 74 28 69 2d 6b 29 2b 64 69 67 69 _count(i-k)+digi
30a0: 74 5f 63 6f 75 6e 74 28 63 6e 74 29 2b 64 69 67 t_count(cnt)+dig
30b0: 69 74 5f 63 6f 75 6e 74 28 6f 66 73 74 29 2b 33 it_count(ofst)+3
30c0: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 63 6e ;. if( cn
30d0: 74 3e 3d 73 7a 20 26 26 20 63 6e 74 3e 62 65 73 t>=sz && cnt>bes
30e0: 74 43 6e 74 20 29 7b 0a 20 20 20 20 20 20 20 20 tCnt ){.
30f0: 20 20 2f 2a 20 52 65 6d 65 6d 62 65 72 20 74 68 /* Remember th
3100: 69 73 20 6d 61 74 63 68 20 6f 6e 6c 79 20 69 66 is match only if
3110: 20 69 74 20 69 73 20 74 68 65 20 62 65 73 74 20 it is the best
3120: 73 6f 20 66 61 72 20 61 6e 64 20 69 74 0a 20 20 so far and it.
3130: 20 20 20 20 20 20 20 20 2a 2a 20 64 6f 65 73 20 ** does
3140: 6e 6f 74 20 69 6e 63 72 65 61 73 65 20 74 68 65 not increase the
3150: 20 66 69 6c 65 20 73 69 7a 65 20 2a 2f 0a 20 20 file size */.
3160: 20 20 20 20 20 20 20 20 62 65 73 74 43 6e 74 20 bestCnt
3170: 3d 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 20 = cnt;.
3180: 20 62 65 73 74 4f 66 73 74 20 3d 20 69 53 72 63 bestOfst = iSrc
3190: 2d 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 62 65 -k;. be
31a0: 73 74 4c 69 74 73 7a 20 3d 20 6c 69 74 73 7a 3b stLitsz = litsz;
31b0: 0a 20 20 20 20 20 20 20 20 20 20 44 45 42 55 47 . DEBUG
31c0: 32 28 20 70 72 69 6e 74 66 28 22 2e 2e 2e 20 42 2( printf("... B
31d0: 45 53 54 20 53 4f 20 46 41 52 5c 6e 22 29 3b 20 EST SO FAR\n");
31e0: 29 0a 20 20 20 20 20 20 20 20 7d 0a 0a 20 20 20 ). }..
31f0: 20 20 20 20 20 2f 2a 20 43 68 65 63 6b 20 74 68 /* Check th
3200: 65 20 6e 65 78 74 20 6d 61 74 63 68 69 6e 67 20 e next matching
3210: 62 6c 6f 63 6b 20 2a 2f 0a 20 20 20 20 20 20 20 block */.
3220: 20 69 42 6c 6f 63 6b 20 3d 20 63 6f 6c 6c 69 64 iBlock = collid
3230: 65 5b 69 42 6c 6f 63 6b 5d 3b 0a 20 20 20 20 20 e[iBlock];.
3240: 20 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 57 65 20 }.. /* We
3250: 68 61 76 65 20 61 20 63 6f 70 79 20 63 6f 6d 6d have a copy comm
3260: 61 6e 64 20 74 68 61 74 20 64 6f 65 73 20 6e 6f and that does no
3270: 74 20 63 61 75 73 65 20 74 68 65 20 64 65 6c 74 t cause the delt
3280: 61 20 74 6f 20 62 65 20 6c 61 72 67 65 72 0a 20 a to be larger.
3290: 20 20 20 20 20 2a 2a 20 74 68 61 6e 20 61 20 6c ** than a l
32a0: 69 74 65 72 61 6c 20 69 6e 73 65 72 74 2e 20 20 iteral insert.
32b0: 53 6f 20 61 64 64 20 74 68 65 20 63 6f 70 79 20 So add the copy
32c0: 63 6f 6d 6d 61 6e 64 20 74 6f 20 74 68 65 20 64 command to the d
32d0: 65 6c 74 61 2e 0a 20 20 20 20 20 20 2a 2f 0a 20 elta.. */.
32e0: 20 20 20 20 20 69 66 28 20 62 65 73 74 43 6e 74 if( bestCnt
32f0: 3e 30 20 29 7b 0a 20 20 20 20 20 20 20 20 69 66 >0 ){. if
3300: 28 20 62 65 73 74 4c 69 74 73 7a 3e 30 20 29 7b ( bestLitsz>0 ){
3310: 0a 20 20 20 20 20 20 20 20 20 20 2f 2a 20 41 64 . /* Ad
3320: 64 20 61 6e 20 69 6e 73 65 72 74 20 63 6f 6d 6d d an insert comm
3330: 61 6e 64 20 62 65 66 6f 72 65 20 74 68 65 20 63 and before the c
3340: 6f 70 79 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 opy */.
3350: 20 70 75 74 49 6e 74 28 62 65 73 74 4c 69 74 73 putInt(bestLits
3360: 7a 2c 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 z,&zDelta);.
3370: 20 20 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b *(zDelta++
3380: 29 20 3d 20 27 3a 27 3b 0a 20 20 20 20 20 20 20 ) = ':';.
3390: 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 memcpy(zDelta
33a0: 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 62 , &zOut[base], b
33b0: 65 73 74 4c 69 74 73 7a 29 3b 0a 20 20 20 20 20 estLitsz);.
33c0: 20 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d 20 62 zDelta += b
33d0: 65 73 74 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20 estLitsz;.
33e0: 20 20 20 20 62 61 73 65 20 2b 3d 20 62 65 73 74 base += best
33f0: 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20 Litsz;.
3400: 20 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28 DEBUG2( printf(
3410: 22 69 6e 73 65 72 74 20 25 64 5c 6e 22 2c 20 62 "insert %d\n", b
3420: 65 73 74 4c 69 74 73 7a 29 3b 20 29 0a 20 20 20 estLitsz); ).
3430: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62 }. b
3440: 61 73 65 20 2b 3d 20 62 65 73 74 43 6e 74 3b 0a ase += bestCnt;.
3450: 20 20 20 20 20 20 20 20 70 75 74 49 6e 74 28 62 putInt(b
3460: 65 73 74 43 6e 74 2c 20 26 7a 44 65 6c 74 61 29 estCnt, &zDelta)
3470: 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 6c ;. *(zDel
3480: 74 61 2b 2b 29 20 3d 20 27 40 27 3b 0a 20 20 20 ta++) = '@';.
3490: 20 20 20 20 20 70 75 74 49 6e 74 28 62 65 73 74 putInt(best
34a0: 4f 66 73 74 2c 20 26 7a 44 65 6c 74 61 29 3b 0a Ofst, &zDelta);.
34b0: 20 20 20 20 20 20 20 20 44 45 42 55 47 32 28 20 DEBUG2(
34c0: 70 72 69 6e 74 66 28 22 63 6f 70 79 20 25 64 20 printf("copy %d
34d0: 62 79 74 65 73 20 66 72 6f 6d 20 25 64 5c 6e 22 bytes from %d\n"
34e0: 2c 20 62 65 73 74 43 6e 74 2c 20 62 65 73 74 4f , bestCnt, bestO
34f0: 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20 20 20 fst); ).
3500: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 2c *(zDelta++) = ',
3510: 27 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 62 ';. if( b
3520: 65 73 74 4f 66 73 74 20 2b 20 62 65 73 74 43 6e estOfst + bestCn
3530: 74 20 2d 31 20 3e 20 6c 61 73 74 52 65 61 64 20 t -1 > lastRead
3540: 29 7b 0a 20 20 20 20 20 20 20 20 20 20 6c 61 73 ){. las
3550: 74 52 65 61 64 20 3d 20 62 65 73 74 4f 66 73 74 tRead = bestOfst
3560: 20 2b 20 62 65 73 74 43 6e 74 20 2d 20 31 3b 0a + bestCnt - 1;.
3570: 20 20 20 20 20 20 20 20 20 20 44 45 42 55 47 32 DEBUG2
3580: 28 20 70 72 69 6e 74 66 28 22 6c 61 73 74 52 65 ( printf("lastRe
3590: 61 64 20 62 65 63 6f 6d 65 73 20 25 64 5c 6e 22 ad becomes %d\n"
35a0: 2c 20 6c 61 73 74 52 65 61 64 29 3b 20 29 0a 20 , lastRead); ).
35b0: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 }.
35c0: 20 62 65 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20 bestCnt = 0;.
35d0: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 break;.
35e0: 20 20 20 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 49 }.. /* I
35f0: 66 20 77 65 20 72 65 61 63 68 20 74 68 69 73 20 f we reach this
3600: 70 6f 69 6e 74 2c 20 69 74 20 6d 65 61 6e 73 20 point, it means
3610: 6e 6f 20 6d 61 74 63 68 20 69 73 20 66 6f 75 6e no match is foun
3620: 64 20 73 6f 20 66 61 72 20 2a 2f 0a 20 20 20 20 d so far */.
3630: 20 20 69 66 28 20 62 61 73 65 2b 69 2b 4e 48 41 if( base+i+NHA
3640: 53 48 3e 6c 65 6e 4f 75 74 20 29 7b 0a 20 20 20 SH>lenOut ){.
3650: 20 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20 /* We have
3660: 72 65 61 63 68 65 64 20 74 68 65 20 65 6e 64 20 reached the end
3670: 6f 66 20 74 68 65 20 66 69 6c 65 20 61 6e 64 20 of the file and
3680: 68 61 76 65 20 6e 6f 74 20 66 6f 75 6e 64 20 61 have not found a
3690: 6e 79 0a 20 20 20 20 20 20 20 20 2a 2a 20 6d 61 ny. ** ma
36a0: 74 63 68 65 73 2e 20 20 44 6f 20 61 6e 20 22 69 tches. Do an "i
36b0: 6e 73 65 72 74 22 20 66 6f 72 20 65 76 65 72 79 nsert" for every
36c0: 74 68 69 6e 67 20 74 68 61 74 20 64 6f 65 73 20 thing that does
36d0: 6e 6f 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 not match */.
36e0: 20 20 20 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f putInt(lenO
36f0: 75 74 2d 62 61 73 65 2c 20 26 7a 44 65 6c 74 61 ut-base, &zDelta
3700: 29 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 );. *(zDe
3710: 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 lta++) = ':';.
3720: 20 20 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 memcpy(zDe
3730: 6c 74 61 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d lta, &zOut[base]
3740: 2c 20 6c 65 6e 4f 75 74 2d 62 61 73 65 29 3b 0a , lenOut-base);.
3750: 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 2b zDelta +
3760: 3d 20 6c 65 6e 4f 75 74 2d 62 61 73 65 3b 0a 20 = lenOut-base;.
3770: 20 20 20 20 20 20 20 62 61 73 65 20 3d 20 6c 65 base = le
3780: 6e 4f 75 74 3b 0a 20 20 20 20 20 20 20 20 62 72 nOut;. br
3790: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 0a 20 20 eak;. }..
37a0: 20 20 20 20 2f 2a 20 41 64 76 61 6e 63 65 20 74 /* Advance t
37b0: 68 65 20 68 61 73 68 20 62 79 20 6f 6e 65 20 63 he hash by one c
37c0: 68 61 72 61 63 74 65 72 2e 20 20 4b 65 65 70 20 haracter. Keep
37d0: 6c 6f 6f 6b 69 6e 67 20 66 6f 72 20 61 20 6d 61 looking for a ma
37e0: 74 63 68 20 2a 2f 0a 20 20 20 20 20 20 68 61 73 tch */. has
37f0: 68 5f 6e 65 78 74 28 26 68 2c 20 7a 4f 75 74 5b h_next(&h, zOut[
3800: 62 61 73 65 2b 69 2b 4e 48 41 53 48 5d 29 3b 0a base+i+NHASH]);.
3810: 20 20 20 20 20 20 69 2b 2b 3b 0a 20 20 20 20 7d i++;. }
3820: 0a 20 20 7d 0a 20 20 2f 2a 20 4f 75 74 70 75 74 . }. /* Output
3830: 20 61 20 66 69 6e 61 6c 20 22 69 6e 73 65 72 74 a final "insert
3840: 22 20 72 65 63 6f 72 64 20 74 6f 20 67 65 74 20 " record to get
3850: 61 6c 6c 20 74 68 65 20 74 65 78 74 20 61 74 20 all the text at
3860: 74 68 65 20 65 6e 64 20 6f 66 0a 20 20 2a 2a 20 the end of. **
3870: 74 68 65 20 66 69 6c 65 20 74 68 61 74 20 64 6f the file that do
3880: 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 61 6e 79 es not match any
3890: 74 68 69 6e 67 20 69 6e 20 74 68 65 20 73 6f 75 thing in the sou
38a0: 72 63 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20 rce file.. */.
38b0: 20 69 66 28 20 62 61 73 65 3c 6c 65 6e 4f 75 74 if( base<lenOut
38c0: 20 29 7b 0a 20 20 20 20 70 75 74 49 6e 74 28 6c ){. putInt(l
38d0: 65 6e 4f 75 74 2d 62 61 73 65 2c 20 26 7a 44 65 enOut-base, &zDe
38e0: 6c 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65 6c lta);. *(zDel
38f0: 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 20 ta++) = ':';.
3900: 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 2c 20 memcpy(zDelta,
3910: 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 6c 65 6e &zOut[base], len
3920: 4f 75 74 2d 62 61 73 65 29 3b 0a 20 20 20 20 7a Out-base);. z
3930: 44 65 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 2d Delta += lenOut-
3940: 62 61 73 65 3b 0a 20 20 7d 0a 20 20 2f 2a 20 4f base;. }. /* O
3950: 75 74 70 75 74 20 74 68 65 20 66 69 6e 61 6c 20 utput the final
3960: 63 68 65 63 6b 73 75 6d 20 72 65 63 6f 72 64 2e checksum record.
3970: 20 2a 2f 0a 20 20 70 75 74 49 6e 74 28 63 68 65 */. putInt(che
3980: 63 6b 73 75 6d 28 7a 4f 75 74 2c 20 6c 65 6e 4f cksum(zOut, lenO
3990: 75 74 29 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20 ut), &zDelta);.
39a0: 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 *(zDelta++) = '
39b0: 3b 27 3b 0a 20 20 66 72 65 65 28 63 6f 6c 6c 69 ;';. free(colli
39c0: 64 65 29 3b 0a 20 20 72 65 74 75 72 6e 20 7a 44 de);. return zD
39d0: 65 6c 74 61 20 2d 20 7a 4f 72 69 67 44 65 6c 74 elta - zOrigDelt
39e0: 61 3b 20 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 a; .}../*.** Ret
39f0: 75 72 6e 20 74 68 65 20 73 69 7a 65 20 28 69 6e urn the size (in
3a00: 20 62 79 74 65 73 29 20 6f 66 20 74 68 65 20 6f bytes) of the o
3a10: 75 74 70 75 74 20 66 72 6f 6d 20 61 70 70 6c 79 utput from apply
3a20: 69 6e 67 0a 2a 2a 20 61 20 64 65 6c 74 61 2e 20 ing.** a delta.
3a30: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 72 6f 75 74 .**.** This rout
3a40: 69 6e 65 20 69 73 20 70 72 6f 76 69 64 65 64 20 ine is provided
3a50: 73 6f 20 74 68 61 74 20 61 6e 20 70 72 6f 63 65 so that an proce
3a60: 64 75 72 65 20 74 68 61 74 20 69 73 20 61 62 6c dure that is abl
3a70: 65 0a 2a 2a 20 74 6f 20 63 61 6c 6c 20 64 65 6c e.** to call del
3a80: 74 61 5f 61 70 70 6c 79 28 29 20 63 61 6e 20 6c ta_apply() can l
3a90: 65 61 72 6e 20 68 6f 77 20 6d 75 63 68 20 73 70 earn how much sp
3aa0: 61 63 65 20 69 73 20 72 65 71 75 69 72 65 64 0a ace is required.
3ab0: 2a 2a 20 66 6f 72 20 74 68 65 20 6f 75 74 70 75 ** for the outpu
3ac0: 74 20 61 6e 64 20 68 65 6e 63 65 20 61 6c 6c 6f t and hence allo
3ad0: 63 61 74 65 20 6e 6f 72 20 6d 6f 72 65 20 73 70 cate nor more sp
3ae0: 61 63 65 20 74 68 61 74 20 69 73 20 72 65 61 6c ace that is real
3af0: 6c 79 0a 2a 2a 20 6e 65 65 64 65 64 2e 0a 2a 2f ly.** needed..*/
3b00: 0a 69 6e 74 20 64 65 6c 74 61 5f 6f 75 74 70 75 .int delta_outpu
3b10: 74 5f 73 69 7a 65 28 63 6f 6e 73 74 20 63 68 61 t_size(const cha
3b20: 72 20 2a 7a 44 65 6c 74 61 2c 20 69 6e 74 20 6c r *zDelta, int l
3b30: 65 6e 44 65 6c 74 61 29 7b 0a 20 20 69 6e 74 20 enDelta){. int
3b40: 73 69 7a 65 3b 0a 20 20 73 69 7a 65 20 3d 20 67 size;. size = g
3b50: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 etInt(&zDelta, &
3b60: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 28 lenDelta);. if(
3b70: 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 29 *zDelta!='\n' )
3b80: 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 {. /* ERROR:
3b90: 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f 74 size integer not
3ba0: 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 22 terminated by "
3bb0: 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 72 \n" */. retur
3bc0: 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 72 65 74 75 n -1;. }. retu
3bd0: 72 6e 20 73 69 7a 65 3b 0a 7d 0a 0a 0a 2f 2a 0a rn size;.}.../*.
3be0: 2a 2a 20 41 70 70 6c 79 20 61 20 64 65 6c 74 61 ** Apply a delta
3bf0: 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6f 75 74 70 ..**.** The outp
3c00: 75 74 20 62 75 66 66 65 72 20 73 68 6f 75 6c 64 ut buffer should
3c10: 20 62 65 20 62 69 67 20 65 6e 6f 75 67 68 20 74 be big enough t
3c20: 6f 20 68 6f 6c 64 20 74 68 65 20 77 68 6f 6c 65 o hold the whole
3c30: 20 6f 75 74 70 75 74 0a 2a 2a 20 66 69 6c 65 20 output.** file
3c40: 61 6e 64 20 61 20 4e 55 4c 20 74 65 72 6d 69 6e and a NUL termin
3c50: 61 74 6f 72 20 61 74 20 74 68 65 20 65 6e 64 2e ator at the end.
3c60: 20 20 54 68 65 20 64 65 6c 74 61 5f 6f 75 74 70 The delta_outp
3c70: 75 74 5f 73 69 7a 65 28 29 0a 2a 2a 20 72 6f 75 ut_size().** rou
3c80: 74 69 6e 65 20 77 69 6c 6c 20 64 65 74 65 72 6d tine will determ
3c90: 69 6e 65 20 74 68 69 73 20 73 69 7a 65 20 66 6f ine this size fo
3ca0: 72 20 79 6f 75 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 r you..**.** The
3cb0: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 20 73 68 delta string sh
3cc0: 6f 75 6c 64 20 62 65 20 6e 75 6c 6c 2d 74 65 72 ould be null-ter
3cd0: 6d 69 6e 61 74 65 64 2e 20 20 42 75 74 20 74 68 minated. But th
3ce0: 65 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a e delta string.*
3cf0: 2a 20 6d 61 79 20 63 6f 6e 74 61 69 6e 20 65 6d * may contain em
3d00: 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61 72 61 bedded NUL chara
3d10: 63 74 65 72 73 20 28 69 66 20 74 68 65 20 69 6e cters (if the in
3d20: 70 75 74 20 61 6e 64 20 6f 75 74 70 75 74 20 61 put and output a
3d30: 72 65 0a 2a 2a 20 62 69 6e 61 72 79 20 66 69 6c re.** binary fil
3d40: 65 73 29 20 73 6f 20 77 65 20 61 6c 73 6f 20 68 es) so we also h
3d50: 61 76 65 20 74 6f 20 70 61 73 73 20 69 6e 20 74 ave to pass in t
3d60: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65 he length of the
3d70: 20 64 65 6c 74 61 20 69 6e 0a 2a 2a 20 74 68 65 delta in.** the
3d80: 20 6c 65 6e 44 65 6c 74 61 20 70 61 72 61 6d 65 lenDelta parame
3d90: 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 ter..**.** This
3da0: 66 75 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 function returns
3db0: 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65 the size of the
3dc0: 20 6f 75 74 70 75 74 20 66 69 6c 65 20 69 6e 20 output file in
3dd0: 62 79 74 65 73 20 28 65 78 63 6c 75 64 69 6e 67 bytes (excluding
3de0: 0a 2a 2a 20 74 68 65 20 66 69 6e 61 6c 20 4e 55 .** the final NU
3df0: 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 61 L terminator cha
3e00: 72 61 63 74 65 72 29 2e 20 20 45 78 63 65 70 74 racter). Except
3e10: 2c 20 69 66 20 74 68 65 20 64 65 6c 74 61 20 73 , if the delta s
3e20: 74 72 69 6e 67 20 69 73 0a 2a 2a 20 6d 61 6c 66 tring is.** malf
3e30: 6f 72 6d 65 64 20 6f 72 20 69 6e 74 65 6e 64 65 ormed or intende
3e40: 64 20 66 6f 72 20 75 73 65 20 77 69 74 68 20 61 d for use with a
3e50: 20 73 6f 75 72 63 65 20 66 69 6c 65 20 6f 74 68 source file oth
3e60: 65 72 20 74 68 61 6e 20 7a 53 72 63 2c 0a 2a 2a er than zSrc,.**
3e70: 20 74 68 65 6e 20 74 68 69 73 20 72 6f 75 74 69 then this routi
3e80: 6e 65 20 72 65 74 75 72 6e 73 20 2d 31 2e 0a 2a ne returns -1..*
3e90: 2a 0a 2a 2a 20 52 65 66 65 72 20 74 6f 20 74 68 *.** Refer to th
3ea0: 65 20 64 65 6c 74 61 5f 63 72 65 61 74 65 28 29 e delta_create()
3eb0: 20 64 6f 63 75 6d 65 6e 74 61 74 69 6f 6e 20 61 documentation a
3ec0: 62 6f 76 65 20 66 6f 72 20 61 20 64 65 73 63 72 bove for a descr
3ed0: 69 70 74 69 6f 6e 0a 2a 2a 20 6f 66 20 74 68 65 iption.** of the
3ee0: 20 64 65 6c 74 61 20 66 69 6c 65 20 66 6f 72 6d delta file form
3ef0: 61 74 2e 0a 2a 2f 0a 69 6e 74 20 64 65 6c 74 61 at..*/.int delta
3f00: 5f 61 70 70 6c 79 28 0a 20 20 63 6f 6e 73 74 20 _apply(. const
3f10: 63 68 61 72 20 2a 7a 53 72 63 2c 20 20 20 20 20 char *zSrc,
3f20: 20 2f 2a 20 54 68 65 20 73 6f 75 72 63 65 20 6f /* The source o
3f30: 72 20 70 61 74 74 65 72 6e 20 66 69 6c 65 20 2a r pattern file *
3f40: 2f 0a 20 20 69 6e 74 20 6c 65 6e 53 72 63 2c 20 /. int lenSrc,
3f50: 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4c 65 /* Le
3f60: 6e 67 74 68 20 6f 66 20 74 68 65 20 73 6f 75 72 ngth of the sour
3f70: 63 65 20 66 69 6c 65 20 2a 2f 0a 20 20 63 6f 6e ce file */. con
3f80: 73 74 20 63 68 61 72 20 2a 7a 44 65 6c 74 61 2c st char *zDelta,
3f90: 20 20 20 20 2f 2a 20 44 65 6c 74 61 20 74 6f 20 /* Delta to
3fa0: 61 70 70 6c 79 20 74 6f 20 74 68 65 20 70 61 74 apply to the pat
3fb0: 74 65 72 6e 20 2a 2f 0a 20 20 69 6e 74 20 6c 65 tern */. int le
3fc0: 6e 44 65 6c 74 61 2c 20 20 20 20 20 20 20 20 20 nDelta,
3fd0: 20 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 /* Length of th
3fe0: 65 20 64 65 6c 74 61 20 2a 2f 0a 20 20 63 68 61 e delta */. cha
3ff0: 72 20 2a 7a 4f 75 74 20 20 20 20 20 20 20 20 20 r *zOut
4000: 20 20 20 20 2f 2a 20 57 72 69 74 65 20 74 68 65 /* Write the
4010: 20 6f 75 74 70 75 74 20 69 6e 74 6f 20 74 68 69 output into thi
4020: 73 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 s preallocated b
4030: 75 66 66 65 72 20 2a 2f 0a 29 7b 0a 20 20 75 6e uffer */.){. un
4040: 73 69 67 6e 65 64 20 69 6e 74 20 6c 69 6d 69 74 signed int limit
4050: 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 ;. unsigned int
4060: 20 74 6f 74 61 6c 20 3d 20 30 3b 0a 20 20 63 68 total = 0;. ch
4070: 61 72 20 2a 7a 4f 72 69 67 4f 75 74 20 3d 20 7a ar *zOrigOut = z
4080: 4f 75 74 3b 0a 0a 20 20 6c 69 6d 69 74 20 3d 20 Out;.. limit =
4090: 67 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 getInt(&zDelta,
40a0: 26 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 &lenDelta);. if
40b0: 28 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 ( *zDelta!='\n'
40c0: 29 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a ){. /* ERROR:
40d0: 20 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f size integer no
40e0: 74 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 t terminated by
40f0: 22 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 "\n" */. retu
4100: 72 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 7a 44 65 rn -1;. }. zDe
4110: 6c 74 61 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d lta++; lenDelta-
4120: 2d 3b 0a 20 20 77 68 69 6c 65 28 20 2a 7a 44 65 -;. while( *zDe
4130: 6c 74 61 20 26 26 20 6c 65 6e 44 65 6c 74 61 3e lta && lenDelta>
4140: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 0 ){. unsigne
4150: 64 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 3b d int cnt, ofst;
4160: 0a 20 20 20 20 63 6e 74 20 3d 20 67 65 74 49 6e . cnt = getIn
4170: 74 28 26 7a 44 65 6c 74 61 2c 20 26 6c 65 6e 44 t(&zDelta, &lenD
4180: 65 6c 74 61 29 3b 0a 20 20 20 20 73 77 69 74 63 elta);. switc
4190: 68 28 20 7a 44 65 6c 74 61 5b 30 5d 20 29 7b 0a h( zDelta[0] ){.
41a0: 20 20 20 20 20 20 63 61 73 65 20 27 40 27 3a 20 case '@':
41b0: 7b 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 {. zDelta
41c0: 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a ++; lenDelta--;.
41d0: 20 20 20 20 20 20 20 20 6f 66 73 74 20 3d 20 67 ofst = g
41e0: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 etInt(&zDelta, &
41f0: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 20 20 20 lenDelta);.
4200: 20 20 20 69 66 28 20 7a 44 65 6c 74 61 5b 30 5d if( zDelta[0]
4210: 21 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20 20 !=',' ){.
4220: 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 6f 70 /* ERROR: cop
4230: 79 20 63 6f 6d 6d 61 6e 64 20 6e 6f 74 20 74 65 y command not te
4240: 72 6d 69 6e 61 74 65 64 20 62 79 20 27 2c 27 20 rminated by ','
4250: 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 65 74 */. ret
4260: 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 urn -1;.
4270: 7d 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 }. zDelta
4280: 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a ++; lenDelta--;.
4290: 20 20 20 20 20 20 20 20 44 45 42 55 47 31 28 20 DEBUG1(
42a0: 70 72 69 6e 74 66 28 22 43 4f 50 59 20 25 64 20 printf("COPY %d
42b0: 66 72 6f 6d 20 25 64 5c 6e 22 2c 20 63 6e 74 2c from %d\n", cnt,
42c0: 20 6f 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20 ofst); ).
42d0: 20 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a total += cnt;.
42e0: 20 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 if( tota
42f0: 6c 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 l>limit ){.
4300: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 /* ERROR: c
4310: 6f 70 79 20 65 78 63 65 65 64 73 20 6f 75 74 70 opy exceeds outp
4320: 75 74 20 66 69 6c 65 20 73 69 7a 65 20 2a 2f 0a ut file size */.
4330: 20 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e return
4340: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 -1;. }.
4350: 20 20 20 20 20 20 20 69 66 28 20 6f 66 73 74 2b if( ofst+
4360: 63 6e 74 20 3e 20 6c 65 6e 53 72 63 20 29 7b 0a cnt > lenSrc ){.
4370: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
4380: 4f 52 3a 20 63 6f 70 79 20 65 78 74 65 6e 64 73 OR: copy extends
4390: 20 70 61 73 74 20 65 6e 64 20 6f 66 20 69 6e 70 past end of inp
43a0: 75 74 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 ut */.
43b0: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 return -1;.
43c0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 6d 65 6d }. mem
43d0: 63 70 79 28 7a 4f 75 74 2c 20 26 7a 53 72 63 5b cpy(zOut, &zSrc[
43e0: 6f 66 73 74 5d 2c 20 63 6e 74 29 3b 0a 20 20 20 ofst], cnt);.
43f0: 20 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 zOut += cnt
4400: 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b ;. break;
4410: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 . }. c
4420: 61 73 65 20 27 3a 27 3a 20 7b 0a 20 20 20 20 20 ase ':': {.
4430: 20 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e zDelta++; len
4440: 44 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 Delta--;.
4450: 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a 20 total += cnt;.
4460: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c if( total
4470: 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 20 >limit ){.
4480: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 69 /* ERROR: i
4490: 6e 73 65 72 74 20 63 6f 6d 6d 61 6e 64 20 67 69 nsert command gi
44a0: 76 65 73 20 61 6e 20 6f 75 74 70 75 74 20 6c 61 ves an output la
44b0: 72 67 65 72 20 74 68 61 6e 20 70 72 65 64 69 63 rger than predic
44c0: 74 65 64 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 ted */.
44d0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 return -1;.
44e0: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 44 45 }. DE
44f0: 42 55 47 31 28 20 70 72 69 6e 74 66 28 22 49 4e BUG1( printf("IN
4500: 53 45 52 54 20 25 64 5c 6e 22 2c 20 63 6e 74 29 SERT %d\n", cnt)
4510: 3b 20 29 0a 20 20 20 20 20 20 20 20 69 66 28 20 ; ). if(
4520: 63 6e 74 3e 6c 65 6e 44 65 6c 74 61 20 29 7b 0a cnt>lenDelta ){.
4530: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 /* ERR
4540: 4f 52 3a 20 69 6e 73 65 72 74 20 63 6f 75 6e 74 OR: insert count
4550: 20 65 78 63 65 65 64 73 20 73 69 7a 65 20 6f 66 exceeds size of
4560: 20 64 65 6c 74 61 20 2a 2f 0a 20 20 20 20 20 20 delta */.
4570: 20 20 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 return -1;.
4580: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 }.
4590: 20 6d 65 6d 63 70 79 28 7a 4f 75 74 2c 20 7a 44 memcpy(zOut, zD
45a0: 65 6c 74 61 2c 20 63 6e 74 29 3b 0a 20 20 20 20 elta, cnt);.
45b0: 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 3b zOut += cnt;
45c0: 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 . zDelta
45d0: 2b 3d 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 += cnt;.
45e0: 6c 65 6e 44 65 6c 74 61 20 2d 3d 20 63 6e 74 3b lenDelta -= cnt;
45f0: 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a . break;.
4600: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 }. ca
4610: 73 65 20 27 3b 27 3a 20 7b 0a 20 20 20 20 20 20 se ';': {.
4620: 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 zDelta++; lenD
4630: 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20 elta--;.
4640: 7a 4f 75 74 5b 30 5d 20 3d 20 30 3b 0a 20 20 20 zOut[0] = 0;.
4650: 20 20 20 20 20 69 66 28 20 63 6e 74 21 3d 63 68 if( cnt!=ch
4660: 65 63 6b 73 75 6d 28 7a 4f 72 69 67 4f 75 74 2c ecksum(zOrigOut,
4670: 20 74 6f 74 61 6c 29 20 29 7b 0a 20 20 20 20 20 total) ){.
4680: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 /* ERROR:
4690: 62 61 64 20 63 68 65 63 6b 73 75 6d 20 2a 2f 0a bad checksum */.
46a0: 20 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e return
46b0: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 -1;. }.
46c0: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c if( total
46d0: 21 3d 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 !=limit ){.
46e0: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 67 /* ERROR: g
46f0: 65 6e 65 72 61 74 65 64 20 73 69 7a 65 20 64 6f enerated size do
4700: 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 70 72 65 es not match pre
4710: 64 69 63 74 65 64 20 73 69 7a 65 20 2a 2f 0a 20 dicted size */.
4720: 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 return
4730: 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 -1;. }.
4740: 20 20 20 20 20 20 72 65 74 75 72 6e 20 74 6f 74 return tot
4750: 61 6c 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 al;. }.
4760: 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20 20 20 default: {.
4770: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 75 /* ERROR: u
4780: 6e 6b 6e 6f 77 6e 20 64 65 6c 74 61 20 6f 70 65 nknown delta ope
4790: 72 61 74 6f 72 20 2a 2f 0a 20 20 20 20 20 20 20 rator */.
47a0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 return -1;.
47b0: 20 20 7d 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 }. }. }.
47c0: 2f 2a 20 45 52 52 4f 52 3a 20 75 6e 74 65 72 6d /* ERROR: unterm
47d0: 69 6e 61 74 65 64 20 64 65 6c 74 61 20 2a 2f 0a inated delta */.
47e0: 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 7d 0a return -1;.}.